来源:AICG工具箱 责编:网络 时间:2025-05-15 12:40:00
9月19日报道丨北京时间9月19日凌晨,苹果正式向iOS用户推送了最新版本的iOS 17系统更新。AI元年,AIGC大浪潮之下,苹果恐怕很难再回避大模型带来的话题热度。作为一家消费电子大厂,苹果的 Transformer 架构AI大模型的底细,已经被国外一名技术发烧友给扒出来了。
今年WWDC 2023开发者大会上,苹果发布了iOS 17系统与macOS Sonoma 系统,内置一项AI生成的输入法功能,可以通过用户输入的文本来预测后边的内容。从某种角度来说,苹果并不愿意将此功能称之为“人工智能”。国外一位名叫 Jack Cook 的小哥,就把 macOS Sonoma 翻了个底朝天,结果,还真挖出不少新鲜信息。
Cook 的本科和硕士毕业于麻省理工学院的计算机专业,目前还在攻读牛津大学的计算机硕士。他曾在英伟达实习,专注于 BERT 等语言模型的研究。他还是《纽约时报》的自然语言处理高级研发工程师。
从模型架构上,Cook 认为苹果的大语言模型更倾向基于 GPT-2 打造。在分词器(tokenizer)方面,Emoji的表情符号在其中的比重十分突出。
苹果的大语言模型基于GPT-2架构
苹果的AI大模型能力,主要体现在输入法方面。苹果自带的输入法可以实现单词预测和纠错的功能。
Jack Cook具体测试了一下,发现这个功能主要针对单个单词的预测进行实现。
大模型有时也能预测即将出现的多个单词,但这仅限于已经输入的句子语义十分明确的前提下。
Cook推测苹果的模型应该是基于 GPT-2 架构打造。他甚至扒出了更多关于 GPT-2的关键信息量。比如在 token embeddings、位置编码、解码器块和输出层,每个解码器块中都有类似 gpt2_transformer_layer_3d 这样的字眼,里边就包含“GPT2”的关键词。
Cook 还推测,苹果模型的每一层约有 3400 万参数,隐藏层大小是 512。也就是说,它比 GPT-2 参数量最小的版本还要小。他认为,苹果此举是因为需要在移动终端设备上运行就需要更加的省电,同时能够保持快速、频繁运行。
苹果大模型建立在手机端侧进行运算
苹果官方在 WWDC 上的说法是:“每点击一个键,iPhone 就会运行模型一次。”这就意味着,每一次手指动作都是一次文本生成的过程,这样就无法很好地连贯续写文本段落。
Cook 的文章一经发布,就引发了网友的热议。其中一名网友表示:“我一直认为这就是人工智能应该部署的方式。与其试图将AI作为端到端的云服务解决方案来销售,不如让它首先承担力所能及的一小部分。它对于终端设备来说具有成本效益,对于用户来说也很有价值。是一个双赢工程!”
3月28日,2024黑马AI培训战略发布会启动仪式上邀请了两位重量级嘉宾,以“老人”的姿态,为今天的创业者指点迷津。
春节将至年味渐浓,阿里云通义千问APP上线多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法。
【AI奇点网2024年8月27日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
ChatGPT的插件功能已经面对PLUS用户公开测试一段时间了。在拿到插件测试资格后,小编自然也是欣喜不已,但是看着这80多个插件,真的头大,到底哪个好用?哪个是垃圾?
iPhone 16新品将在9月10日发布丨云知声推出「山海」多模态模型丨商汤科技推出「元萝卜」国际象棋AI下棋机器人
讯飞星火大模型3.0测评_对比ChatGPT怎么样?
pika使用技巧_pika十大技巧怎么用
PikaAI怎么用_PIkaAI怎样生成视频_AI视频生成器Pika怎么用_AI视频生成工具Pika教程
ControlNet是什么_ ControlNet 有什么用
使用 ChatGPT编程的常见示例
华军软件园发布9月AI产品榜丨零一万物发布新版大模型Yi-Lightning丨李开复:中美顶尖大模型性能差距只有五个月
2024诺贝尔化学奖授予谷歌DeepMind CEO丨联发科发布天玑9400旗舰AI芯片丨Sora负责人被谷歌挖墙脚
ChatGPT计划在年底将订阅费涨到22美元/月丨Llama 3.2发布:手机端侧可运行丨百度世界大会将于11月12日举行
阿里通义Qwen2、GPT-4o等大厂模型开展2024高考全科测评:来看看“AI状元”花落谁家?