英伟达CEO黄仁勋:将为中国市场提供符合美国规定的新产品

·正在新加坡访问的英伟达首席执行官黄仁勋表示,中国市场占英伟达销售额的20%左右,英伟达将为中国市场提供一套符合美国政府最新规定的新产品。

·英伟达正与新加坡政府合作创建一个使用11种语言训练的大型语言模型。12月4日,新加坡发布国家人工智能策略2.0。

12月6日,英伟达首席执行官黄仁勋在新加坡出席记者会。

美国芯片企业英伟达公司的首席执行官黄仁勋12月6日表示,在生产“最好的”人工智能芯片的竞赛中,华为是英伟达“非常强大”的竞争对手之一。他透露,英伟达正在与美国政府密切合作,确保面向中国市场的新芯片符合出口限制。

正在新加坡访问的黄仁勋在记者会上表示,华为、英特尔和不断壮大的半导体初创公司对英伟达在人工智能芯片市场的主导地位构成了严峻挑战。“我们在中国内外都有很多竞争对手。”他说。

英伟达的芯片已成为人工智能热潮中最热门的商品,因为它们为训练大语言模型提供了最有效的方法。但美国政府对英伟达的芯片销售设置了壁垒,今年10月中旬更是进一步收紧了英伟达芯片对中国的出口。美国商务部长吉娜·雷蒙多12月2日称:“我们不能让中国获得这些芯片。”

针对雷蒙多的这一言论,中国外交部发言人汪文斌12月4日在例行记者会上回应称,美方应当树立正确的对华认知,同中方一道切实落实中美元首旧金山会晤达成的重要共识,停止将中国视为“假想敌”,纠正打着竞争的幌子搞大国对抗的错误行径。

黄仁勋表示,中国市场占英伟达销售额的20%左右,该公司将继续“完美”遵守贸易法规,并为中国市场提供一套符合美国政府最新规定的新产品。他补充说,英伟达需要寻求市场的建议,这一过程正在进行中。

英伟达11月在财报中警告称,美国新规实施后,预计第四季度在中国的销售额将大幅下降。

在访问新加坡期间,黄仁勋与新加坡总理李显龙举行了会晤。12月4日,新加坡发布国家人工智能策略2.0,提出把该国人工智能从业者的队伍扩大到1.5万人。黄仁勋表示,此行将与李显龙深入探讨英伟达如何帮助、支持和参与该策略。

新加坡资讯通信媒体发展局(IMDA)4日宣布斥资7000万元推出国家多模态大型语言模型计划,计划开发东南亚首个具有区域特点的基础语言模型。黄仁勋表示,目前英伟达正在与资讯通信媒体发展局合作创建由11种语言训练的大模型SEA-LION。该模型旨在更好地理解和代表东南亚的不同背景、语言和文化。

今年第三季度,英伟达来自新加坡市场的营收达到27亿美元,占其总营收的约15%。黄仁勋表示,英伟达在新加坡拥有两类重要客户。一类是新加坡本地的云服务提供商,该国有1100家人工智能初创公司,它们正推动新加坡云端GPU消费的需求。第二类客户则是将产品部署到中国的公司,这类公司在新加坡交易,但将产品和服务用于中国市场。

新加坡拥有由格芯(GlobalFoundries)等全球企业运营的非尖端芯片的制造工厂。英伟达的人工智能芯片首选制造商台积电和恩智浦半导体也在新加坡经营着一家合资企业。

中国半导体行业协会:全球化一旦被破坏,必然会产生严重负面影响

7月19日,中国半导体行业协会发布关于维护半导体产业全球化发展的声明。声明全文如下:

近日,我协会注意到媒体广泛报道了一些美国芯片企业的领导人正试图游说美国政府减少贸易限制、推动全球合作。美国半导体行业协会也发布了“关于美国政府对半导体产业潜在额外限制的声明”。这集中反映了美国半导体产业界对美国政府所作所为的担忧。

数十年来,半导体产业能够持续创新并蓬勃发展,得益于全球各主要国家和地区产业主体的相互协作,是全球化分工发展的结果,半导体产业也因此成为全球化最充分的代表。中国大陆作为全球最大的半导体市场,为全球合作伙伴提供了超过80%的巨大市场,有力地支撑了全球电子信息产品的供应,为全人类的福祉(包括最不发达国家)做出了重要贡献。中国半导体行业协会坚信,经过数十年发展起来的半导体产业全球化一旦被破坏,必然会对全球经济产生严重的负面影响,不仅会导致半导体全球供应链的碎片化,也会破坏全球市场的统一,进而断送全球经济的繁荣。过去二十多年,美国半导体产业积极推动和引领了半导体产业的全球化分工,为半导体产业的全球化做出了重要贡献。令人遗憾的是,美国政府近年采取了一系列限制措施破坏半导体产业的全球化,破坏半导体全球供应链的稳定,将不可避免地损害全球消费者的利益,也会削弱美国半导体产业的竞争力,理所当然地引发了包括美国半导体产业在内的全球人士的广泛担忧。

中国半导体产业根植于全球化,成长和壮大于全球化。我们将始终坚持开放合作,与世界各国、各地区一切愿意合作的产业界同仁共同维护半导体产业的全球化,推动政府/当局支持半导体产业的国际合作。同时,中国半导体产业也会持续创新,不断提升自己的竞争力,与全球伙伴共同发展。

当地时间7月17日,美国半导体行业协会(SIA)在官网就美国​政府对半导体可能实施的额外限制发表声明。声明称,白宫反复采取过于广泛、模糊不清、有时是单方面的限制措施,可能会削弱美国半导体行业的竞争力,破坏供应链,引发重大市场不确定性。SIA敦促白宫与行业和专家更广泛地进行接触,在评估当前和潜在限制措施的影响之前,不要再实施进一步的限制措施,以确定它们是否狭窄且明确定义,是否一致适用,并且是否与盟友充分协调。

7月18日,有记者向中国外交部发言人毛宁提问:据彭博社报道,拜登政府对中国的投资管制,计划把范围限缩到只针对先进技术的新投资,预计直到明年才有可能实施。据了解,白宫官员正准备在8月底前为这项延宕已久的计划总结出一个提案,目的为检查甚至禁止美国对中国半导体、量子计算和人工智能(AI) 领域的投资。包括生物科技和能源产业等领域则不在限制范围之内。请问发言人对此有何回应?

毛宁说,中方一贯反对美方将经贸科技问题政治化、武器化,我们认为对正常的技术合作和经贸往来人为设置障碍这种做法违反市场经济原则,扰乱全球产供链稳定,不符合任何一方的利益。我们希望美方将拜登总统“无意对华‘脱钩’,无意阻挠中国经济发展,无意围堵中国”的承诺落到实处,为中美经贸合作创造良好的环境。

白宫要求美国人更广泛通报三大高科技领域对华投资情况,中方回应

当地时间8月9日,白宫发布美国总统拜签署的行政命令,从明年开始禁止美国人对中国敏感技术的某些投资。

当地时间8月9日,白宫发布美国总统拜签署的行政命令,从明年开始禁止美国人对中国敏感技术的某些投资。

经过数月的讨论后,美国总统拜登当地时间8月9日发布一项行政命令,将从明年开始禁止美国人对中国敏感技术的某些投资,并要求向美国政府报告相关科技领域的投资情况。命令中,“涵盖的国家安全技术和产品”是指对一个国家的军事、情报、监视或网络能力至关重要的半导体和微电子、量子信息技术和人工智能领域的敏感技术和产品。

中国驻美国大使馆发言人刘鹏宇当天在一份声明中表示,中方对美国继续推进投资限制的决定感到“非常失望”,并将维护自身利益。“中方反对美方过度利用国家安全理由,将贸易、科技问题政治化、武器化,故意为正常的经贸交流和技术合作设置障碍。”刘鹏宇指出。

中国商务部8月10日指出,美方限制本国企业对外投资,打着“去风险”的幌子在投资领域搞“脱钩断链”,严重背离美方一贯提倡的市场经济和公平竞争原则,影响企业正常经营决策,破坏国际经贸秩序,严重扰乱全球产业链供应链安全,中方对此表示严重关切,将保留采取措施的权利。希望美方尊重市场经济规律和公平竞争原则,不要人为阻碍全球经贸交流与合作,不要为世界经济恢复增长设置障碍。

这项行政命令要求阻止“美国人”对中国半导体和微电子、量子信息技术和人工智能的某些投资,例如主要为军事和情报用途设计的人工智能系统、芯片设计自动化软件和量子技术,称这些技术“可能会破坏加密和其他网络安全控制并危及军事通信”。命令还要求美国投资者向财政部通报对其中一些目标行业开发技术的公司的潜在投资。

在应通报和禁止的交易中,行政命令称:“财政部长(部长)应与商务部长以及其他相关行政部门和机构(机构)负责人酌情协商,根据公众公告和意见,发布法规,要求美国人提供与涉及受涵盖外国人的某些交易(应通报的交易)相关的信息通知,并禁止美国人从事涉及受涵盖外国人的某些其他交易(禁止交易)。”

文件解释称,“所涵盖的外国人(covered foreign person)”是指参与根据本命令发布的法规中所确定的涉及一种或多种所涵盖的国家安全技术和产品的活动的受关注国家的个人。“美国人(United States person)”一词是指任何美国公民、合法永久居民、根据美国或美国境内任何司法管辖区法律组建的实体,包括任何此类实体的任何外国分支机构,以及在美国境内的任何人。

违反规定的投资者可能会面临罚款并被迫撤资。这些规定适用于未来的交易,但不包括对中国股票和债券的组合投资。

美国财政部表示,预计将豁免“某些交易,包括潜在的公开交易工具以及从美国母公司到子公司的公司内部转移”。

在明年执行新规则之前,拜登政府将完成多轮公众意见征求,其中包括最初的45天公众意见咨询阶段,可能导致该禁令的范围缩小。

《华尔街日报》报道称,当天业界反应平淡。一些行业代表表示,与立法者考虑的方法相比,该行动的范围相对狭窄。《华盛顿邮报》援引分析人士的话称,至少就目前而言,任何此类禁令对中国的影响都可能微乎其微。

美国半导体行业协会表示,期待提供意见,并补充说“我们希望最终规则允许美国芯片公司在公平的竞争环境中竞争并进入包括中国在内的主要全球市场”。美国国家风险投资协会表示正在密切关注,“以确保对美国公司的投资不会产生意想不到的后果。”

《纽约时报》将白宫的这一行动称为“美国在与中国的经济冲突中为遏制金融流动而采取的首批重要措施之一”。分析人士认为,沟通和执行这项措施将会很困难,美国“商界已经开始反对私人市场政治化”。通信技术专家项立刚8月9日对《环球时报》记者表示,美国明年就要举行大选,拜登政府在竞选压力之下需要显示对华强硬态度,因此会将打压中国的措施作为拉选票的工具。在这种情况下,华盛顿并不看重这些措施实施后的效果,即便美国企业的利益将受到损害。

英特尔推出玻璃基板计划:重新定义芯片封装,推动摩尔定律进步

英特尔已在玻璃基板技术上投入了大约十年时间。

有机基板和玻璃基板的对比。图片来源:英特尔

组装测试芯片基板。

 ·英特尔公司推出用于下一代先进封装的玻璃基板,称这一“程碑式的成就”将重新定义芯片封装的边界,能够为数据中心、人工智能和图形构建提供改变游戏规则的解决方案,推动摩尔定律进步。

·英特尔计划在本十年晚些时候开始出货。第一批获得玻璃基板处理的产品将是其规模最大、利润最高的产品,例如高端HPC(高性能计算)和AI芯片。

英特尔已在玻璃基板技术上投入了大约十年时间。

当地时间9月18日,芯片制造商英特尔公司宣布,在用于下一代先进封装的玻璃基板开发方面取得重大突破。

在本周于美国加利福尼亚州圣何塞举行的英特尔2023年创新大会之前,英特尔宣布了这一“程碑式的成就”,并称这将重新定义芯片封装的边界,能够为数据中心、人工智能和图形构建提供改变游戏规则的解决方案,推动摩尔定律进步。该公司表示,将于本十年晚些时候使用玻璃基板进行先进封装。

1971年,英特尔的第一款微处理器拥有2300个晶体管,现在该公司的旗舰芯片拥有超过1000亿个晶体管,但这种进步大部分来自于芯片电路之间宽度的微型化。如今这种进步已经放缓。由英特尔创始人戈登·摩尔发明的“摩尔定律”(半导体芯片的晶体管密度每24个月翻一番)甚至被认为已经失效。因此,英特尔一直在寻找其他方法来让芯片技术继续遵循摩尔定律。

在谈论芯片设计的下一步发展时,人们关注的焦点包括填充更多内核、提高时钟速度、缩小晶体管和3D堆叠等,很少考虑承载和连接这些组件的封装基板。

基板是芯片封装体的重要组成材料,主要起承载保护芯片与连接上层芯片和下层电路板的作用。它们为芯片提供了结构稳定性(硅芯片非常脆弱),也是传输信号的手段。自上世纪70年代以来,基板设计发生了多次演变,金属框架在90年代被陶瓷所取代,然后在世纪之交被有机封装所取代。当前的处理器广泛使用有机基板。

英特尔认为,有机基板将在未来几年达到其能力的极限,因为该公司将生产面向数据中心的系统级封装(SiP),具有数十个小瓦片(tile),功耗可能高达数千瓦。此类SiP需要小芯片(chiplet)之间非常密集的互连,同时确保整个封装在生产过程中或使用过程中不会因热量而弯曲。

英特尔预计,玻璃基板具有卓越的机械、物理和光学特性,使该公司能够构建更高性能的多芯片SiP,在芯片上多放置50%的裸片(die)。特别是,英特尔预计玻璃基板能够实现容纳多片硅的超大型24×24cm SiP。

玻璃基板是指用玻璃取代有机封装中的有机材料,并不意味着用玻璃取代整个基板。因此,英特尔不会将芯片安装在纯玻璃上,而是基板核心的材料将由玻璃制成。

有机基板和玻璃基板的对比。图片来源:英特尔

与传统有机基材相比,玻璃具有一系列优点。其突出特点之一是超低平坦度,可改善光刻的焦深,以及互连的良好尺寸稳定性,这对于下一代SiP来说非常重要。此类基板还提供良好的热稳定性和机械稳定性,使其能够承受更高的温度,从而在数据中心应用中更具弹性。

此外,英特尔表示,玻璃基板可实现更高的互连密度(即更紧密的间距),使互连密度增加十倍成为可能,这对于下一代SiP的电力和信号传输至关重要。玻璃基板还可将图案变形减少50%,从而提高光刻的焦深并确保半导体制造更加精密和准确。

英特尔称,玻璃基板可能为未来十年内在单个封装上实现惊人的1万亿个晶体管奠定基础。

为了证明该技术的有效性,英特尔发布了一款用于客户端的全功能测试芯片。这项技术最初将用于构建面向数据中心的处理器,但当技术变得更加成熟后,将用于客户端计算应用程序。英特尔提到,图形处理器(GPU)是该技术的可能应用之一,很可能会受益于互连密度的增加和玻璃基板刚性的提高。

组装测试芯片基板。

英特尔已在玻璃基板技术上投入了大约十年时间,目前在美国亚利桑那州拥有一条完全集成的玻璃研发线。该公司表示,这条生产线的成本超过10亿美元,为了使其正常运行,需要与设备和材料合作伙伴合作,建立一个完整的生态系统。业内只有少数公司能够负担得起此类投资,而英特尔似乎是迄今为止唯一一家开发出玻璃基板的公司。

与任何新技术一样,玻璃基板的生产和封装成本将比经过验证的有机基板更昂贵。英特尔目前还没有谈论产量。如果产品开发按计划进行,该公司打算在本十年晚些时候开始出货。第一批获得玻璃基板处理的产品将是其规模最大、利润最高的产品,例如高端HPC(高性能计算)和AI芯片,随后逐步推广到更小的芯片中,直到该技术可用于英特尔的普通消费芯片。

苹果自研调制解调器芯片受挫:速度太慢容易过热,落后高通3年

苹果硬件技术高级副总裁约翰尼·斯鲁吉(Johny Srouji)领导了芯片研发。

苹果自研芯片家族。

·去年底的测试发现,苹果自研的调制解调器芯片速度太慢且容易过热,电路板尺寸太大,占据半个iPhone的面积,无法使用。这些芯片基本上比高通最好的调制解调器芯片落后3年。

·熟悉该项目的苹果前工程师和高管透露,由于技术挑战、沟通不畅,以及高层对尝试设计芯片而不是购买芯片是否明智的问题存在分歧,苹果调制解调器芯片的工程团队工作进展缓慢,且设定了不切实际的目标。

苹果硬件技术高级副总裁约翰尼·斯鲁吉(Johny Srouji)领导了芯片研发。

据苹果公司前工程师和高管透露,该公司原计划将其自研调制解调器芯片用在最新的iPhone机型中,但去年年底的测试发现,该芯片速度太慢且容易过热,电路板尺寸太大,占据半个iPhone的面积,无法使用。

调制解调器芯片的作用是连接手机与无线运营商,iPhone目前依赖高通公司生产的调制解调器芯片。本月上旬,高通宣布将苹果的采购合同延长3年,业界推测苹果自主研发调制解调器芯片的计划遇到挫折。

2018年,苹果首席执行官蒂姆·库克(Tim Cook)下达设计和制造调制解调器芯片的命令,并招聘数千名工程师。目标是切断苹果对高通的依赖。据估计,去年苹果已向高通支付了超过72亿美元芯片采购费用。在2017年的诉讼中,苹果指控高通对其专利使用费收取过高费用。

熟悉该项目的苹果前工程师和高管告诉《华尔街日报》,由于技术挑战、沟通不畅,以及高层对尝试设计芯片而不是购买芯片是否明智的问题存在分歧,苹果调制解调器芯片的工程团队工作进展缓慢。团队被孤立在美国和国外的不同小组中,没有全球领导者。一些高管不鼓励工程师传播有关延误或挫折的坏消息,从而导致设定不切实际的目标和最后期限。

苹果在十多年前就致力于生产用于其产品的各种芯片。2010年1月,苹果创始人史蒂夫·乔布斯在第一代iPad发布会上低调展示了自研的A4芯片,这枚45nm制程的芯片由三星代工,一开始并不被业界看好。一年之后,苹果在iPhone 4S发布会上展示了第二代芯片A5,性能提升巨大。此后,苹果构建了由A系列(手机和平板)、M系列(桌面电脑)、H系列(耳机)、S系列(手表)等多个产品线的芯片家族。特别是在2020年,苹果用M1芯片替代Mac电脑中使用多年的英特尔处理器芯片,震动了市场。今年9月发布的iPhone 15 Pro系列更是搭载了全球首款3nm工艺制程芯片——A17 Pro。

苹果自研芯片家族。

熟悉情况的前苹果高管和工程师表示,苹果相信它可以复制其为iPhone设计的微处理器芯片的成功,但后来发现,设计微处理器相比之下更容易,而传输和接收无线数据的调制解调器芯片必须符合严格的连接标准,与5G无线网络以及世界各国使用的2G、3G和4G网络(每个网络都有自己的技术特点)无缝协作,才能为世界各地的无线运营商提供服务。这是一项耗时的工作。

“仅仅因为苹果生产了地球上最好的芯片,就认为他们也可以生产调制解调器,这是荒谬的。”前苹果无线主管杰迪普·拉纳德(Jaydeep Ranade)说。

苹果公司将其调制解调器芯片项目命名为“Sinope”,以希腊神话中智胜宙斯的仙女命名。参与该项目的人士表示,长期担任苹果无线业务主管的鲁文·卡瓦列罗(Rubén Caballero)当时支持与英特尔进行芯片合作,而硬件技术高级副总裁约翰尼·斯鲁吉(Johny Srouji)支持自研芯片。卡瓦列罗2019年离开苹果后,其团队中许多精通无线芯片设计的成员都被安排在斯鲁吉手下。与此同时,苹果加大了从高通挖人的力度。2019年,苹果宣布收购英特尔的无线团队和无线专利组合。

据知情人士透露,去年年底,苹果测试了自研的调制解调器芯片样品。这些芯片基本上比高通最好的调制解调器芯片落后3年,可能会导致iPhone的无线连接速度比竞争对手慢。苹果取消了在2023年机型中使用该芯片的计划,并把推出时间推迟到2024年,但随后意识到这个目标也无法实现。

今年9月11日,高通在一份声明中宣布与苹果续签调制解调器芯片协议,新协议将涵盖“2024年、2025年和2026年推出的智能手机”。两家公司的协议原定于今年结束。

“这些延误表明苹果没有预料到这项工作的复杂性。”曾长期担任高通高管的塞尔吉·维伦格(Serge Willenegger)表示,“蜂窝网络是一个怪物。”

破解国产大模型难题:避免“无源之水”,最后一公里需连接算法与芯片

·中国工程院院士戴琼海表示:“我国应从政策、机制和投入上深化人工智能的人才培养和基础研究,强化原始创新,避免陷入‘无源之水’的困境。”

·清华大学电子工程系长聘教授汪玉指出:“上海本地已经有许多芯片企业,上海也有很多算法,怎样做到高效统一的部署,在芯片上把这样的算法跑起来,是一个非常重要的问题。”

7月7日,在2023世界人工智能大会“大模型时代的通用人工智能产业发展机遇以及风险”论坛上,多位通用人工智能领域的专家聚焦大模型,分别从基础创新、应用技术、未来前景等层面深度探讨人工智能。

“我国应从政策、机制和投入上深化人工智能的人才培养和基础研究,强化原始创新,避免陷入‘无源之水’的困境。”国务院参事、中国工程院院士戴琼海在主旨演讲中强调。

清华大学电子工程系长聘教授、系主任汪玉则从落地应用角度谈到,目前大模型垂直领域部署难度大,国内大模型落地面临三大挑战:领域部署成本高、模型算力缺口大和国产芯片替代难。“在大模型落地的最后一公里,我们需要将算法与芯片连接起来。” 汪玉说。

“脑智能是未来新的方向”

戴琼海认为,在大模型“0到1”的创新中,国内在基础研究领域的颠覆性成果弱。“从智能发展产业来看,我们是既乐观又不乐观。”在他看来,中国大部分人工智能人才集中于应用层,因此应用场景和技术层的发挥空间特别大。但中国在基础层人才方面明显处于弱势,原始创新不足。

戴琼海表示,人工智能创新发展需要三大支柱,即算法、数据、算力。算法决定智能水平,数据决定智能范围,算力决定智能效率。在算法层面,大模型预计5年左右成为人工智能应用中的关键基础性平台。

戴琼海同时指出,脑智能是未来新的方向。融合脑与认知的人工智能新算法是行业布局的前沿,将引领新一代智能。他在论坛上建议,政府应鼓励企业主导大模型建设,探索生物机制和机器特色相结合,进一步创造人工智能新范式,推动基础研究和应用拓展并举。他预计,以认知智能为核心的人工智能将在十年以后开始步入应用。

此外,戴琼海认为,需要警惕大模型应用的安全问题。大模型尚不能对输出进行可信性的验证,例如生成欺骗性内容。“这意味着大模型的应用一旦出现问题,可不是现在计算机网络病毒那么简单,杀杀毒就好了,这将会带来颠覆性的影响。因此大模型进行应用时,应将安全性和可信性讨论清楚。”

国内大模型应着力解决四个痛点需求

汪玉在论坛中表示,“上海非常关注人工智能和芯片,但从另外一个角度看,我们现在最先进的模型以及比较重要的算力,其实都受到了一定的限制。我们的算力应该往哪个方向去走,国产算力怎么样能更好地弥补起来,这样的空间如何支撑国家在大模型训练和推理等方面的发展,这些问题已经变得极其重要。”

汪玉还提到,目前在国外,大算力芯片只有英伟达和AMD这两个公司可以选。英伟达占据主导市场,并且其软件生态比较好。“所以国外各种各样的模型,例如OpenAI、微软、谷歌,都在大批量地采购英伟达的芯片,然后在英伟达的软件框架之上去进行开发。国外的生态是很简单的,企业做好算法这一领域,部署方面有英伟达的软件体系来支撑。”

“但中国目前大算力芯片的发展还处于起步阶段。”汪玉认为,“上海本地已经有许多芯片企业,例如天数智芯、燧原科技、寒武纪、壁仞科技等。上海也有很多算法,怎样做到高效统一的部署,在芯片上把这样的算法跑起来,是一个非常重要的问题。”

汪玉同时强调,目前大模型垂直领域部署难度大,国内大模型落地面临三大挑战:领域部署成本高、模型算力缺口大和国产芯片替代难。

“与过去AI 1.0时代的一个模型针对一个特定任务不同,当今AI 2.0时代是一个模型解决多个任务,应用层、算法层、系统层需要协同优化。”汪玉表示,在大模型落地的最后一公里,国内大模型应着力解决四个痛点需求。

“我们首先需要处理长文本的问题,即用得好。”汪玉谈到,目前算法的趋势是将大模型支持的文本长度不断增大,但长文本也将带来负载激增的问题,Transformer(谷歌开发的一种深度学习模型,OpenAI在此基础上开发了GPT)架构的负载会随着输入变长而急剧增加。因此调整长文本是一个极其重要的需求。

大模型的另一个需求是性价比的提升。“如果谷歌在搜索引擎中应用大模型,这将增加360亿美元的成本,而利润可能损失65%。”汪玉表示,若公司能够做到降低一次点击的成本,整体的利润损失可能会降低。按此方向发展,每个人都有望用得起大模型。

此外,大模型需要赋能多种垂直领域,对于各行各业而言,目前并没有很多大模型拥有大量知识。尤其在医疗、金融等领域,语料数据获取代价昂贵,并且非常稀少。“如果能够加上通用基座大模型,并且进行微调,各行各业的基础性能有望进一步提升。”但汪玉也指出,如果在垂直领域发展,通用大模型一定要进行微调,而模型越大,微调的代价也随之大幅增高。因此,如何设计高效的微调算法是一个需要探讨的话题。

与此同时,大模型也带来了一站式部署的新需求。在软硬件的优化中,若将算子优化、编译调优、硬件部署进行分层部署,每日一共需要100个人力,而对于一站式自动化部署,每日只需要10个人力。汪玉指出,一站式部署能够优化人力成本,进一步增大编译优化空间规模,有望推动整个产业链的发展。