改变格局?Meta与微软合作发布开源模型可免费商用,威胁OpenAI

Llama 2的参数。

·Meta发布其最新开源人工智能模型Llama 2,可免费用于研究和商业用途。微软成为Llama 2的首选合作伙伴。这可能对生成式人工智能软件市场的现有格局带来改变,加剧大模型间的竞争。

·高通和Meta同日宣布,从2024年开始,Llama 2可以在手机和PC上的高通芯片上运行,该技术将使智能虚拟助理等应用成为可能。

Meta首席执行官马克·扎克伯格最近攻势猛烈。

在社交媒体产品Threads挑战推特并成为史上用户增长最快的App之一后,当地时间7月18日,Meta发布其最新开源人工智能模型Llama 2,可免费用于研究和商业用途。Llama自发布后便被称为AI社区内最强大的开源大模型,但因为开源协议一直不可免费商用。

值得注意的是,Meta同时宣布微软是Llama 2的首选合作伙伴,Llama 2将由微软通过其云服务分发,并在Windows操作系统上运行。众所周知,微软一直和OpenAI在生成式人工智能方面密切合作。

除了微软,Llama 2也可通过亚马逊云(AWS)、Hugging Face等其他提供商获取。

Meta首席人工智能科学家杨立昆(Yann LeCun)在推特上表示,“这将改变大语言模型(LLM)市场的格局。”

Llama模型是什么?

Llama全称为Large Language Model Meta AI,今年2月,Meta推出了第一个较小版本的Llama,仅限研究人员使用。Meta当时称,Llama参数量仅为OpenAI的大模型GPT-3的10%,但性能却优于GPT-3。

与GPT-3相比,Meta在一开始就将Llama定位成一个“开源的研究工具”,该模型所使用的是各类公开可用的数据集(例如Common Crawl、维基百科以及C4)。该项目组成员纪尧姆·兰普尔(Guillaume Lample)在推文中指出,“与Chinchilla、PaLM或GPT-3不同,我们只使用公开可用的数据集,这就让我们的工作与开源兼容且可以重现。而大多数现有模型,仍依赖于非公开可用或未明确记录的数据内容。”

Llama 2的参数。

此次Meta发布的Llama 2实际上是一个开源AI大语言模型系列,包含70亿、130 亿和700亿3种参数变体。此外,他们还训练了340亿参数变体,但只在技术报告中提及,并未发布。

据扎克伯格介绍,Llama 2的训练数据相比Llama 1多了40%,纳入了超过100万条人工注释,以提高其输出的质量。

Meta副总裁艾哈迈德·阿尔达勒(Ahmad Al-Dahle)表示,训练数据有两个来源:在线抓取的数据,以及根据人类注释者的反馈进行微调和调整的数据集。Meta表示,它没有在Llama 2中使用Meta的用户数据,并排除了来自拥有大量个人信息的网站的数据。

业内人士认为,从某种意义上讲,Llama是对2022年3月发表的Chinchilla模型及其论文《训练计算优化型大模型》(Training Compute-Optimal Large Models)的直接反应。这篇论文的核心观点是,AI训练与推理的最佳性能未必由大模型的参数量直接决定。相反,增加训练数据并缩小模型体量才是达成最佳性能的前提。这样的训练可能需要更多时间,但也会带来有趣的意外收获——在推理新数据时,小模型的速度更快。

也是在这种思路下,大模型Llama 2可以“在边缘”或“在设备上”,而不是“在云端”运行。

当地时间7月18日,高通和Meta宣布,从2024年开始,Llama 2可以在手机和PC上的高通芯片上运行。到目前为止,因为对计算能力和数据的巨大需求,大型语言模型主要在大型数据中心运行。高通表示,该技术将使智能虚拟助理等应用成为可能。

“100亿-150亿参数级别的模型可以覆盖绝大多数生成式AI的用例。”高通技术公司产品管理高级副总裁兼AI负责人齐亚德·阿斯哈尔(Ziad Asghar)7月初在接受澎湃科技(www.thepaper.cn)采访时介绍,“届时我们会拥有非常丰富的使用场景,手机会成为真正的个人助理,与手机交流和交互,能够成为我们日常行为的自然延伸,如用于预约会议、写邮件,以及在娱乐和内容生产上。”

成为OpenAI的领先替代方案

Llama模型商业版本的开源将对生成式人工智能软件市场的现有格局带来改变,它可以成为收费的ChatGPT的绝佳替代品,可能将加剧大模型间的竞争。

某种程度上,开源模型的任何渐进式改进都会蚕食闭源模型的市场份额。斯坦福大学基础模型研究中心主任Percy Liang表示,像Llama 2这样强大的开源模型对OpenAI构成了相当大的威胁。Liang是自然语言处理(NLP)领域的著名研究者,师从机器学习泰斗迈克尔·乔丹(Michael I. Jordan)。

“Llama 2不是GPT-4。”Liang说,Meta在其研究论文中承认,Llama 2和GPT-4(目前OpenAI最先进的人工智能语言模型)在性能上仍然存在很大差距。“但对于许多用例,你不需要GPT-4。”

Liang认为,像Llama 2这样更加可定制和透明的模型,比起大型、复杂的专有模型,或能让使用者更快地创建产品和服务。

加州大学伯克利分校教授史蒂夫·韦伯(Steve Weber)表示,“让Llama 2成为OpenAI的领先开源替代方案,对Meta来说将是一个巨大的胜利。”   

Meta在发布Llama 2的新闻稿里称,他们相信,“开放的方法是当今人工智能模型开发的正确方法,特别是在技术快速发展的生成领域。”此外,“我们相信它更安全。开放对当今人工智能模型的访问意味着一代开发人员和研究人员可以作为一个社区对其进行压力测试,快速识别和解决问题。”

微软现在是Meta的合作伙伴

作为OpenAI的亲密伙伴,此次微软作为Meta首选合作伙伴的出现意味深长。

一方面可以理解为,为了应对主要云服务竞争对手,微软也希望提供多种人工智能模型供选择。此前,亚马逊云(AWS)宣布,除了自家的Titan之外,还提供由著名初创公司Anthropic开发的人工智能Claude的访问权限。同样,谷歌也表示有意让其云客户使用Claude和其他模型。

另一方面,据此前《华尔街日报》揭秘,微软与OpenAI合作的背后实际上也是“相爱相杀”的关系。

知情人士称微软内部出现了抱怨AI研发预算减少的声音,微软部分研究人员还抱怨OpenAI不愿开放技术细节。知情人士称,虽然微软有少数内部团队可以接触到该模型的底层工作原理,例如代码库和模型权重,但大多数团队还是被直接拒之门外。尽管微软持有OpenAI大量股份,可大部分员工在使用OpenAI模型时享受的待遇甚至等同于普通外部供应商。

与此同时,微软和OpenAI都在营销大模型的使用权,有时是针对同一个客户。而且OpenAI正在加速与企业合作,包括与微软竞争对手的合作,如客户关系管理(CRM)软件服务提供商Salesforce。它们在ChatGPT的支持下打造了Einstein GPT,主要卖点是自动完成某些日常任务,比如生成营销类电子邮件,这跟微软基于OpenAI技术打造的功能高度重合。

当天,微软还宣布,计划就使用其办公软件Microsoft 365的人工智能助手向企业收取每人每月30美元的费用,该软件包括Word和Excel。这个价格是微软目前对Microsoft 365最廉价版本收费的两倍多。消息宣布后,微软股价18日收盘创下历史新高,当天上涨4%,收于359.49美元,今年上涨了约50%。

 

2023年的一款推特模仿品,用户增长速度已远超ChatGPT

Meta首席执行官扎克伯格在网上不断更新Threads用户数。

用户可以通过现有的Instagram账户轻松注册Threads,并从Instagram转移关注者。

·推特的竞争对手Threads在不到24小时内就达到了3000万注册量,而ChatGPT花费60天才拥有3000万用户,过去十年中几乎任何应用程序都无法与Threads的这个增长速度相比。

·马斯克在网上批评Threads,推特的法律团队威胁要对Threads采取法律行动,在一封信中指控Meta参与“非法盗用”其商业机密。

用户可以通过现有的Instagram账户轻松注册Threads,并从Instagram转移关注者。

在7月6日向公众推出后的第二天,Meta公司基于文本的社交应用程序Threads就迎来了用户的爆炸式增长。

根据Meta首席执行官马克·扎克伯格公布的数据,Threads在发布不到24小时内就达到了3000万注册量,而ChatGPT花费60天才拥有3000万用户,过去十年中几乎任何应用程序都无法与Threads的这个增长速度相比。而就在几天前,美国媒体还在讨论社交媒体已陷入困境的话题。

这款被评价为“看起来和推特一样”的应用程序,正是扎克伯格针对推特发起的一场“突袭”。当地时间7月6日,推特所有者埃隆·马斯克在网上批评Threads,推特的法律团队威胁要对Threads采取法律行动,在一封信中指控Meta参与“非法盗用”其商业机密。

是谁在加入Threads?

猛烈的增长势头还在继续。扎克伯格透露,截至当地时间7月7日上午,Threads的注册人数已超过7000万,这一数字“远远超出了我们的预期”。根据公司内部数据,用户已经发布了超过9500万条帖子和1.9亿个赞。

Meta首席执行官扎克伯格在网上不断更新Threads用户数。

根据统计机构Sensor Tower和data.ai向《时代》杂志提供的数据,Threads是过去十年发布日下载次数最多的非游戏应用程序。Sensor Tower称,7月6日Threads在全球的下载量已达到约4000万次。data.ai表示,任天堂的《马里奥赛车之旅》是有史以来增长最快的应用程序,Threads排名第二,其用户增长速度超过了Pokemon GO和《使命召唤手游》等流行应用程序。

根据data.ai的数据,Instagram用了15个月时间才达到3000万次下载,而TikTok用了不到两年时间达到这一里程碑。

根据《纽约时报》此前的报道,两位知情人透露,ChatGPT在发布两个月后用户数超过3000万,使其成为记忆中有史以来增长最快的软件产品之一。不过,今年5月ChatGPT的App发布后,下载量略低于1800万次。

Threads的主要吸引力在于,它与社交应用Instagram绑定在一起,用户可以通过现有的Instagram账户轻松注册,并从Instagram转移关注者。Insider Intelligence首席分析师杰斯明·恩伯格(Jasmine Enberg)在一份声明中表示:“Meta只需要四分之一的Instagram用户每月使用Threads,它的规模就能与推特一样大。” 

此外,大量名人账户获得了Threads的早期访问权限,包括微软公司创始人比尔·盖茨、歌手夏奇拉和主持人奥普拉·温弗瑞等公众人物,以及Netflix等品牌。据Axios报道,截至当地时间7月6日晚间,美国国会参众两院535名议员中超过四分之一的人,以及6名共和党总统候选人和白宫高级助手都创建了Threads账户。

Meta这次能成功吗?

Meta公司已经拥有雄厚的社交媒体基础设施,旗下包括Facebook和Instagram,这些家喻户晓的名字使其处于领先地位。 “与大品牌联系在一起是一个优势。”布鲁金斯学会技术创新中心高级研究员达雷尔·韦斯特(Darrell West)告诉《时代》杂志,“Threads不会成为一个小众市场参与者。”

此外,Threads已经产生了怀旧的效果,一些用户将该应用程序的体验与早期的推特进行了比较。

美国消费者新闻与商业频道 (CNBC)评论称,虽然推特因被记者、政治家和学者广泛使用而闻名,并且是一个经常发布新闻的地方,但Threads可能会因为与Instagram的绑定而拥有更广泛的受众和关注点。此外,Meta已采取措施不再强调Facebook上的政治内容,这一政策如果延续到Threads上,可以使其与推特区分开来。

“人们不会像在推特上那样使用Threads来了解新闻和全球事件,而且文化也会有所不同。但这可能对Meta有利:即使是最活跃的推特用户也厌倦了持续的混乱和临时变化,而Threads可以提供一个很好的缓解。”恩伯格写道。

科技博客The Split认为,Threads所做的最聪明的事,是采用了类似TikTok一样的瀑布流,用户看到的不止是关注者的内容,还包括平台上的其他推荐内容。

不过,单靠增长迅猛还不足以让Threads成为推特的替代品,经受住时间的考验。它必须证明有能力保持用户的参与度和回头率。

弗吉尼亚大学媒体研究系助理教授凯文·德里斯科尔(Kevin Driscoll)表示,Threads的成功能否持续还有待观察。 “推特和脸书都出现了一些问题,并且是这些高度中心化平台所特有的问题,它们的主要关注点是增长、规模以及早期用户获取,因此没有太多谈论长期可持续性。”

Threads仍然缺乏一些关键功能,例如搜索、主题标签和关注流。Meta也因一项政策受阻,该政策要求用户在尝试删除其Threads账户的同时也删除其Instagram的个人资料。Meta的首席技术官安德鲁·博斯沃思(Andrew Bosworth)在Threads帖子中表示,该公司正在努力修复这个问题。

由于监管方面的担忧,Meta在欧盟国家推出Threads还面临挑战。该地区是Meta的一个重要市场。据《华尔街日报》报道,2023年第一季度该公司280亿美元的广告收入中,欧洲约占22%。

推特的反击和小扎的翻身

扎克伯格并不回避对推特进行猛烈抨击,他在一篇帖子中表示,Threads将“专注于善意”,暗示推特缺少这一点。 “这就是推特从未取得我认为应有的成功的原因之一,我们希望采取不同的做法。”他说。

Threads也被许多人称为“推特杀手”,对马斯克今年早些时候建立的X公司构成威胁。据新兴媒体Semafor报道,就在Threads推出几小时后,X公司的法律团队致函扎克伯格,表达了“对Meta系统性、故意性和非法盗用推特商业机密和其他知识产权的严重担忧”。Meta发言人对此回应称:“Threads工程团队中没有人是推特前员工——这根本不是一回事。”

马斯克在一系列推文中批评了Threads,称其为“闭源、只有算法的系统”,暗示这可能意味着“对人们所看到的信息的操纵基本上是无法检测到的”。在回复有关Meta在社交媒体占主导地位的推文时,他写道:“任何社交媒体垄断都是令人绝望的。”

值得注意的是,Instagram负责人亚当·莫斯利(Adam Mosseri)表示,Threads发布时不会提供ActivityPub支持。ActivityPub是一种用于在去中心化网络上发布信息的协议。但Threads计划在未来允许与其他Fediverse(联邦宇宙)服务器进行交互。

联邦宇宙由一系列用户自建或第三方托管的互相连接的服务器组成,虽然各个服务器是独立运行的,但在这些服务器上所运行的软件支持一种或多种遵循开放标准的通信协议,这样不同服务器的数据就可以互联互通。也就是说,如果推特和Facebook都加入联邦宇宙,那么用户就可以用推特账户去关注Facebook的好友,还能跟他互动、聊天、发文件。

Threads的出场有望让扎克伯格打一场翻身仗。Meta近年来的发展并不顺利,发生了一系列备受瞩目的丑闻和失误,包括大规模裁员,活动人士和监管机构批评该公司未能保护用户免受平台伤害以及对用户数据处理不当。2021年该公司高调推出的元宇宙战略也进展缓慢。

“这是我们所希望的一个良好的开始!”扎克伯格在Threads上发帖,“感觉像是一些特别的事情的开始。”