来源:AICG工具箱 责编:网络 时间:2025-06-03 13:07:46
6月16日报道丨搜狗创始人王小川在腾讯全面收购搜狗后,离开创办的百川智能公司,主要业务是人工智能领域开发。日前,他宣布推出了 70 亿参数量的中英文预训练大模型 ——baichuan-7B。目前 baichuan-7B 大模型已在 Hugging Face、Github 以及 Model Scope 平台发布。
百川智能方面表示,为了验证模型的各项能力,baichuan-7B 在 C-Eval、AGIEval 和 Gaokao 三个最具影响力的中文评估基准进行了综合评估,并且均获得了优异成绩,它已经成为同等参数规模下中文表现最优秀的原生预训练模型。
王小川主持开发的百川智能7B大模型,基于Transformer结构,通过在大约1.2万亿个tokens上进行训练而成。该模型具有强大的语言理解和生成能力,可以应用于各种自然语言处理任务,如文本分类、问答系统、翻译等。
据介绍,baichuan-7B 代码采用 Apache-2.0 协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用。北京大学和清华大学已率先使用 baichuan-7B 模型推进相关研究工作,并计划在未来与百川智能深入合作,共同推动 baichuan-7B 模型的应用和发展。
百川智能 CEO 王小川表示:“本次开源模型的发布是百川智能成立 2 个月后的第一个里程碑,对百川智能而言是一个良好的开局。baichuan-7B 模型,不仅能为中国的 AGI 事业添砖加瓦,也为世界大模型开源社区贡献了新的力量。”
据悉,为了拓展人工智能大模型研究的业务,王小川成立人工智能公司百川智能,百川智能于2023年4月10日成立,公司早前已获得5000万美元启动资金,团队已初步搭建完成,分别来自搜狗、百度、华为、微软、字节跳动、腾讯等大厂,以及其他创业公司。王小川表示,公司取名“百川”,背后的寓意即是海纳百川,众多数据、行业知识汇聚成一个强大的智能体系,生生不息。
根据爱企查显示,百川智能的主要经营范围为:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;软件开发;计算机系统服务;人工智能应用软件开发;人工智能双创服务平台;人工智能理论与算法软件开发;人工智能基础软件开发;人工智能通用应用系统;人工智能公共数据平台;人工智能公共服务平台技术咨询服务;人工智能基础资源与技术平台;人工智能硬件销售;人工智能行业应用系统集成服务。
本地SD部署速度一直被大家诟病,本次视频就给大家分享Tensorrt插件是如何秒变“5090”,让你的显卡生图速度提升4倍!
在这个时代里,不是模型越大越好,而是更加贴合实际应用场景的小型化、定制化模型正在成为主流。
DeepL 发布了新一代面向翻译和编辑应用的大型语言模型。据 DeepL 官方称,该模型在翻译质量和流畅度方面均优于当前市场上的其他竞争对手。
当地时间5月21日周二,欧盟理事会正式批准了世界上第一部真正意义的人工智能技术发展与监管的主要要律,该法律对全体欧盟成员国地区有效。
TensorRT插件安装_TensorRT插件怎么提升SD生图速度_stable diffusion插件
阿里“通义听悟”升级:支持6小时超长视频内容解析提问,还可一键生成巨幅思维导图
苹果与OpenAI合作,发布新版Siri与生成式AI功能丨马斯克宣布将禁用iPhone丨OpenAI百万年薪挖角谷歌芯片人才
华为HDC 2024大会将发布盘古大模型5.0丨谷歌Gemini手机版将迎来多项功能更新丨马斯克xAI计划融资60亿美元
苹果WWDC定档6月10日将发布AI战略丨中国时报:苹果与百度尚未达成AI合作丨抖音发布AI数字人治理公告
OpenAI CEO奥特曼最新讲话汇总,再次曝光GPT-5细节:性能飞跃超乎想象,低估它的人都会被吓傻
李开复:最好的AI大模型已经达到人类平均智商的三倍,“杀手级应用”已经出现
重磅!英伟达正式官宣「AI核弹级」芯片B100,性能比H100强两倍的H200将于2024年第二季度出货
面对Sora训练数据来源一问三不知!OpenAI遭遇成立以来最为惨烈的公关灾难
英伟达发布AI算力芯片B200丨高通发布第三代骁龙8s处理器丨李开复:目前最好的大模型已达人类平均IQ的三倍