来源:AICG工具箱 责编:网络 时间:2025-09-01 09:01:23
8月13日消息,商汤科技联合创始人、执行董事、首席科学家林达华在8月12日发布了深度文章《迈向多模态通用智能:商汤的思考》,阐释了发展多模态智能的底层逻辑、技术路径、实践探索与未来方向。
林达华提到,AI的核心目标是通过计算来构建智能,而智能是一个复杂的**度概念,其核心就是与外界(包括世界或者其他人)进行自主交互的能力,可以被归纳为包括感知、推理、决策、学习等多种能力维度。
同时他表示,语言只是人类智能演进过程中的一种产物,不是智能的本源;语言是描述世界的工具,但不是世界本身。他还表示:“单靠语言模型并不能构建真正意义的AGI”。
林达华还指出,大语言模型是朝着AGI(注:通用人工智能)迈出的重要一步,但随着现存的文本语料终有一天会被AI吸收殆尽,AI下一阶段的突破必然要超越语言,回到智能的本源——和世界的交互。
他认为,AI若要具备通用性则必须能像人类一样用感官接收信息,将原始模态转化为可计算的内部表征。他写道:“多模态信息感知与处理的能力是AGI的核心要求,也是从语言模型迈向AGI的必由之路”。
这篇文章,我想好好盘点一下从ChatGPT出现到现在,真正实用且主流的AI工具。包含大语言模型、AI PPT、AI 绘图、AI音频、AI数字人、AI视频这6个部分。
和「秋叶」一起学AI绘画,掌握Stable Diffusion、Midjourney的使用方法,开展AI绘画副业,搞钱!?
美国VC投资机构关于生成式AI的最新研究文章:哪些领域老牌企业仍然占据主导?哪些新兴公司正在崭露头角?ChatGPT之后,谁可能是下一个大赢家?
GPT-4o回归付费用户,用户体验与成本平衡成焦点。
GPT-5 翻车:OpenAI「回滚」大戏与AI扩张隐形边界
通义听悟如何使用自定义专有词汇
通义听悟如何管理发言人_通义听悟如何管理发言人使用方法
通义听悟如何将音视频文件转文字
春节前后罗永浩将发布一款AI软件丨马斯克xAI完成新一轮60亿美元融资丨智谱AI×英特尔打造酷睿Ultra专享版
马斯克与奥特曼「八年的爱恨情仇」:从兄弟联手创办OpenAI,到理念不合、分道扬镳、相爱相杀、对薄公堂
AI走向太空,王坚院士最新演讲,提出“三体计算星座”全球协作倡议
DeepMind CEO定义世界模型标准:不仅理解物理世界,还能创造它
没有杀手级AI应用,李彦宏靠什么扳回一城?
硅谷换血: 大模型时代为何华人取代了印度工程师?