AI魔法学院客服
苹果内部正在测试「苹果 GPT」AppleGPT
 2023-07-20
复制地址分享海报


苹果已在内部测试和 GPT 相似的聊天机器人。
该聊天机器人是基于苹果搭建的 Ajax 框架。
目前,苹果还没想到生成式 AI 在用户层面的应用角度。
彭博社 Mark Gurman 援引知情人士消息称,苹果虽然没有对外公布其生成式 AI 进展,但内部已经在测试和 GPT 相似的服务,部分工程师称之为「苹果 GPT」。
苹果因担心会错失生成式 AI 大潮,在去年已经建立了名为 Ajax 的框架,并在 Ajax 的基础上创立了仅供内部使用的聊天机器人服务「苹果 GPT」。
苹果的 Ajax 系统是建立在 Google Jax 之上。Google Jax 是 Google 的机器学习框架。
此外,苹果也已经基于 Ajax 在内部对搜索、Siri、地图等领域进行了优化。
至于苹果 GPT,这个聊天机器人最开始是由一支小的工程师团队在去年创造的,当时更像是一个实验。
最开始,这个项目因潜在安全担忧被暂停了,但后来却被延伸至更多员工。
目前,这个系统还是需要特殊审批才可访问。而且,苹果要求,任何来自这个系统的输出,都不可用于开发面向用户的功能。
现在,机器学习和人工智能部门的负责人 John Giannandrea 和苹果软件工程师高管 Craig Federighi 正在负责推进生成式 AI 的进展。
然而,知情人士称两人并未能形成统一战线。Giannandrea 会更希望采取保守的方式,观望其他公司相关产品的发展势态。
除了技术上的限制外,苹果现在也仍然没想好生成式 AI 在消费者角度的应用。
即便如此,知情人士还是认为,苹果明年会发布关于 AI 的重要更新。
小伙伴们是不是可以行动起来,赶紧注册相关的域名呢?

微软和 OpenAI 开始专门为训练 AI 生成数据了

要训练更成熟的 AI,网络数据已经不够用。
人工专门撰写的数据安全并无版权问题,但过于昂贵。
AI 公司开始用 AI 生成更专业的数据并配人工精校,用于训练更先进的 AI。
据《金融时报》,微软、OpenAI 和 AI 创业公司 Cohere 已经开始为训练 AI 专门生成数据了。
此前,无论是 GPT 还是 Bard,这些大模型基本上都是用互联网上的数据来训练,如网页、论坛信息、视频或是电子书。
但随着大模型日益变得成熟,这些数据已经显得不足够。
如果你能在网上找到一切你想要的数据,那可太好了。
现实是,网络很多噪音很乱,并不都是你想要的数据。
Cohere CEO Aidan Gomez 说道。
大模型需要更成熟的数据以应对科学、医学或商业上的需求。
理想情况下,这些数据当然最好是由各个领域的专家来撰写,或者是购买企业的专利信息。然而,这也太昂贵了。
因此,用合成数据(synthetic data)成了一种新趋势。
这些公司会用 AI 去生成关于医学、金融等专业领域更复杂的文本或代码,然后拿这些数据去训练比较成熟的大模型。
Gomez 表示,他的不少竞争对手都已经开始用经过人工精校的合成数据去训练 AI 了:
(合成数据)已经很流行了…… 虽然它没有被很广泛地传播。
Gomez 举例,它可以用两个 AI 模型对话聊高数,其中一个是老师,另一个是学生。这些模型对话就会产生很多高数相关的细分信息。
微软在最近的两份研究论文里,也曾表示公司使用了合成数据来训练较小规模的模型。
评论指出,用合成数据训练大模型的危害在于,这些数据不一定能准确地反映真实世界的数据。
鉴于现在网上都有不少数据是 AI 生成的,一不小心 AI 也会抓取到由更初代 AI 生成的原始数据,然后再一次被处理并拿去训练新 AI。