2024年AI报告
发布时间:2025-01-15 04:02:20 来源:雷电竞下载APP官网让我们从最令人兴奋的部分开始:研究。AI在多个领域取得了惊人的进展。大型语言模型(LLMs),如GPT-4和Claude 3.5,在重要基准测试中表现几乎相同,显著缩小了实验室之间的性能差距。但OpenAI并没有止步不前——他们的新o1模型是一个游戏规则改变者,可以通过增强推理解决复杂数学问题,采用逐步推理的方法。
报告中的一个例子显示,OpenAI的o1模型在2024年AIME(数学竞赛)中得分83.83,与其前身相比是一个巨大的飞跃。
尽管我们庆祝这些进步,但我们一定要承认伴随它们的挑战。一个主要担忧是部署AI模型的成本。如报告所述,处理像OpenAI o1这样的模型中的令牌的费用是惊人的——大约每百万输入令牌15美元,输出令牌60美元。这引发了关于可访问性的问题。如果只有少数公司能够负担得起开发和部署最先进的AI系统,那么小型初创公司能带来的创新会发生什么?
因此,我们大家可以解决极其复杂的问题,但代价是什么?这对谁能够负担得起使用这一些尖端模型有何影响?
AI领域最大的辩论之一是闭源模型(如OpenAI的GPT-4)和开源模型(如Meta的LLaMA 3)之间的较量。Llama 3.1 405B在16,000个H100 GPU上进行了训练,是第一个在这个规模上训练的Llama模型。
闭源模型受到严控——昂贵、专有,并由庞大的基础设施支持。它们强大且可靠,但并非人人都能访问。
以GPT-4为例——它在解决复杂问题方面处于前沿,但价格昂贵。与此同时,开源模型如LLaMA 3正在民主化AI。这些模型对公众开放,可定制,并在Hugging Face上下载量超过600万次。
这里有一个问题——仅仅因为它是“开放”的,并不代表它是完全透明的。许可、数据访问和使用限制仍然适用。开放模型允许你创新,但面临挑战,如“数据污染”,这可能会夸大性能。
那么,未来会怎样?事实是,两者将共存。闭源模型在商业用途上占主导地位,而开源模型推动草根创新。真正的问题是:AI将由少数人控制,还是对所有人开放?
转向商业方面,AI公司呈指数级增长。根据报告,AI驱动的公司市值达到惊人的9万亿美元。没错——9万亿美元。但随着这一些企业的增长,我们正真看到权力向少数玩家集中。NVIDIA仍然是主导力量,其强大的GPU推动了从AI研究到数十亿美元的GenAI初创公司的一切。尽管监督管理的机构终于开始审查这种权力集中,但特别难看到小玩家如何在这个生态系统中竞争。
有趣的是,尽管大公司赚取数十亿,但小企业在视频和音频生成等细致划分领域获得了关注。这里的问题是:在大玩家吸收或超越它们之前,这样的一种情况能持续多久?
生成式AI火爆,应用增长迅猛。Synthesia曾经被视为小众,现在已成为大多数财富100强公司的标配。自2020年推出以来,Synthesia已生成超过2400万个视频,其虚拟人视频生成正在改变企业学习、营销和客户服务的方式。这不仅仅是一个趋势——这是内容创作的范式转变。
尽管去年一些生成式AI产品在初始炒作后难以留住用户,但2024年不同。新多个方面数据显示,对生成式AI工具(如OpenAI、Grammarly和Midjourney)的留存和支出正在增加。企业意识到AI可以简化运营并增强参与度,导致更深入地集成到其工作流程中。
投资者也注意到了这一点,AI优先公司以比传统SaaS公司更快的速度扩展收入——平均只需20个月就能达到3000万美元的收入,而SaaS同行需要65个月。这种快速采用表明生成式AI应用不仅仅是时尚;它们正在成为各行业企业的必备工具。
AI擅长生成文本,但如何从庞大的数据集中找到正确的信息呢?这就是检索模型和嵌入的作用。这些模型不仅吐出文本;它们理解上下文,从庞大的数据库中精确提取相关信息。
2024年AI报告强调了检索模型如何变得更智能。例如,OpenAI的模型远远落后于NVIDIA的NV-Embed-v2,后者目前在MTEB检索排行榜上名列前茅。这表明,即使在封闭的世界中,像ColPali这样的开源模型——使用视觉语言嵌入,也能超越大名鼎鼎的模型。
为什么这很重要?嵌入是AI理解的基础——它们将单词和图像映射成机器能处理的向量。更好的嵌入意味着更智能的AI,可以有效的进行更深入的洞察。Anthropic使用上下文嵌入将检索失败减少了35%,使其更快、更准确。
简而言之,检索和嵌入是推动AI搜索、理解和处理复杂信息的幕后英雄。它们不仅帮助AI回答问题——它们正在塑造AI学习的方式。
随着AI模型变得更大更智能,挑战不单单是使其更强大——而是高效扩展。根据2024年AI报告,扩展AI意味着处理大规模数据、更大的模型和更复杂的问题,而不会在计算成本下崩溃。
领先实验室正在开发创新策略,如分布式低通信(DiLoCo),在训练期间减少设备之间的数据交换,允许在更大集群上更快扩展。这种方法在大规模优化期间将通信减少了500倍,使AI模型更高效地训练和运行。
与此同时,电力网络正在成为瓶颈,因为AI增长。实验室正在探索缓解这些物理约束的方法,例如使用更小、更高效的集群,同时仍实现可扩展的性能。AI可扩展性不再仅仅是技术问题——它是基础设施、能源和创新的现实世界挑战。
报告还强调了全球政府如何争相监管AI。美国和欧盟都引入了有争议的立法,试图控制AI的迅速增加。然而,真正的问题是政府努力往往不足——计算需求正在飙升,由于基础设施有限,许多国家落后。这造成了巨大的全球不平衡。随着计算成本上升,对先进AI的访问将仅限于最富有的国家和公司。
此外,报告说明,AI监管继续侧重于被动措施,如缓解选举干扰,而不解决AI在关键基础设施中的更广泛风险。这使得许多人在从就业到个人数据安全的一切方面容易受到未来AI干扰。
旨在遏制中国AI能力的美国制裁并未达到预期效果。报告数据显示,尽管有这些限制,中国实验室仍在取得重大进展。这一发展展示了中国AIECO的韧性和适应性。通过专注于内部建设能力和利用社区驱动倡议,中国研究人员继续推进其模型。
此外,围绕AI的政治叙事是多方面的。这不仅仅是竞争;也是合作。随着AI技术的发展,全球治理慢慢的变必要。报告强调,许多国家正在努力创建确保安全和伦理而不扼杀创新的有效法规。
随着主要实验室重新投资于这一领域,机器人技术正在卷土重来,突显其在现实世界应用中的潜力。2024年AI报告说明,Google DeepMind已成为机器人技术开发的领导者,创建了像AutoRT这样的系统,结合视觉语言模型以增强环境理解。这使得机器人能适应并在以前未见过的环境中执行任务。
RT-Trajectory是DeepMind的另一个创新系统,通过视频输入改进机器人学习,叠加任务的2D草图以提供实用的视觉提示。这种方法帮助机器人更高效地学习并更准确地执行复杂任务。
然而,机器人技术历史上一直面临障碍,主要是缺乏开源数据集和工具。Hugging Face的LeRobot旨在通过托管预训练模型和人工收集的数据集来弥合这一差距,使开发者更容易进入该领域。
此外,扩散模型以其图像生成方面的成功而闻名,现在在机器人技术中证明有效,生成复杂的动作序列。通过将高维观察细化成可操作的见解,这些模型正在推动机器人如何学习与其环境互动的进步。
总的来说,随着投资重新流入机器人技术,格局正在发生明显的变化。公司正在利用先进的AI技术解决长期存在的挑战,使机器人技术不单单是一个趋势,而是未来AI发展的基础方面。
AI领域充满了活动,某些公司正在引领潮流。从独角兽转变行业到老牌巨头重新定义其战略,这些玩家正在塑造人工智能的未来。让我们更仔细地看看2024年掀起波澜的公司及其对市场的重大影响。
ElevenLabs已飙升至独角兽地位,年初估值为11亿美元。它是文本转语音(TTS)市场的领导者,62%的财富500强公司至少使用其一种产品。除了TTS,ElevenLabs还在扩展到外语配音和语音隔离,使其成为AI领域的多功能工具。随着大实验室在语音生成领域谨慎行事,ElevenLabs正在把握机会主导市场。
Mistral已成为欧洲基础模型的冠军,获得了超过10亿欧元的资金。其旗舰模型Au Large展示了令人印象非常深刻的计算效率和多语言能力。Mistral与微软的合作使其模型可在Azure上使用,使其成为欧洲AI领域的关键玩家。
Cerebras以其晶圆级引擎而闻名,年收入同比增长15.6倍,2024年上半年达到1.36亿美元。这一增长反映了其独特的高性能计算方式的强劲需求,特别是在能源和制药等行业。
Waymo在无人驾驶领域取得了重大进展,从SoftBank、NVIDIA和微软获得了额外资金。该公司在美国每周达到10万次付费行程,并正在扩展到新城市。凭借Alphabet的50亿美元支持,Waymo有望利用对自动驾驶车辆服务日渐增长的需求。
Databricks因开源的DBRX而成为头条新闻,这是一个在3000多个NVIDIA GPU上训练的1320亿参数模型,成本为1000万美元。该模型旨在供企业构建和定制,展示了Databricks提供可扩展AI解决方案的承诺。
Runway与Lionsgate合作,在20,000个标题的目录上训练生成模型,标志着AI驱动内容创作的重大一步。这一合作标志着AI与媒体日益交叉,Runway旨在简化电影和视频的生产流程。
OpenAI继续以其创新主导市场,包括备受期待的GPT-4o,尽管面临语音输出和版权问题的审查。该公司与微软的合作伙伴关系进一步巩固了其在AI领域的地位,尽管在创新与监管挑战之间寻求平衡。
Meta转向开源AI重新定义了其公众形象,LLaMA模型的成功明显提升了其股价。这一举措不仅缓解了来自OpenAI和Anthropic的竞争压力,还重新确立了Meta在AI领域的重要地位。
全球监督管理的机构正在努力跟上快速AI发展的步伐。例如,欧盟的AI法案旨在为AI技术建立全面的监管框架。虽然意图良好,但这种监管可能会对小公司造成沉重的合规负担,可能抑制创新。这引发了一个重要问题:我们如何确保法规在促进安全的同时,营造一个初创公司能够蒸蒸日上的环境?
报告呼吁采取平衡的监管方法——强调政府、企业和研究人员之间的合作。随着我们前进,建立关于AI标准的国际协议能够在一定程度上帮助创造一个更稳定的景观,创新与安全并存。
这是大多数人不喜欢谈论的部分——风险。2024年报告说明,AI安全社区发生了“氛围转变”。曾经警告AI对人类存在风险的公司的现在正在竞相加速其采用。为什么?商业化AI的压力空前高涨,尤其是企业希望从面向消费者的AI工具中获利。但随着每一次新的AI突破,潜在的危害也在增长。
报告强调,尚未找到解决臭名昭著的“越狱”问题的办法,用户都能够诱使AI系统绕过安全协议。更糟糕的是,研究人员越来越担心对AI系统的长期攻击可能比我们以前见过的更复杂。尽管存在这些风险,世界各地的政府正在效仿英国,设立AI安全机构研究关键国家基础设施的潜在漏洞。
对美国AI实验室的100亿美元以上投资将触发国家安全审查——我们预计政府将更多地参与,因为大量资金投入AI实验室,引发对战略控制和影响的担忧。
由零编程技能的人创建的应用或网站将走红——随着无代码工具的势头增强,一个由新手创建的平台将很快进入App Store前100名。
前沿实验室将在试验开始后对数据收集进行重大改变——随着法律系统开始审查数据实践,AI实验室将不得已调整其数据收集和管理方式。
欧盟AI法案将比预期更宽松地推出——立法者将稍作退步,担心新法规可能过于严格,使实施更加灵活。
开源模型将在推理基准上超越OpenAI的o1——开源社区继续创新,很可能在各种推理任务上超越像OpenAI的o1这样的专有模型。
NVIDIA的主导地位将保持不变——尽管竞争加剧,但无另外的公司会在AI硬件市场上对NVIDIA的控制产生实质性影响。
人形机器人投资将放缓——人形机器人的炒作将开始消退,因为公司难以找到这些高度复杂机器的真正市场。
苹果将在设备上AI方面取得进展——苹果在设备上AI研究的结果将增强其设备上个人隐私保护AI体验的势头。
AI生成的研究将在主要会议上被接受——完全由AI系统创建的研究论文将在领先的机器学习会议上被接受。
基于生成式AI的视频游戏将大获成功——一款集成生成式AI技术的视频游戏将取得突破性成功,塑造未来游戏和用户互动的方式。
让我们暂停一下——当AI系统变得如此先进以至于超越人类智能时会发生啥?我们谈论的是一个未来,AI不仅在执行任务上比人类更好,而且开始为我们做决定。2024年AI报告表明,我们比以往任何一个时间里都更接近这个现实,AI模型已经展示了几年前很难来想象的能力。但我们准备好了一个机器可以在从科学研究到政策制定的每个方面超越人类判断的世界吗?
想想看:像AlphaFold 3这样的模型现在通过建模蛋白质相互作用设计整个药物治疗方案,这曾经需要人类研究人员数年时间。4月,AlphaFold 3发布,它完全改变了科学家理解分子生物学的方式。但当AI系统开始设计的不单单是我们的药物,还有我们的经济、城市甚至我们的关系时,会发生什么?
这就是人间不公!731部队细菌战犯逃回日本后,很多人在医院、学校等公立机构担任要职
731部队是日本军国主义者在第二次世界大战期间下令组建的细菌战秘密部队之一。1931年到1945年期间,731部队进行骇人听闻的人体实验和细菌战等,在中国犯下滔天罪行。数千名中国、苏联、朝鲜战俘和中国平民被用于人体细菌和毒气实验。
深圳特区报发布的一则视频展示了国产人形机器人的行走能力。视频中,有着成年人身高的机器人稳步前行,行走姿态、速度与人类非常相近。英伟达高级AI研究科学家Jim Fan转发其行走视频并感叹:“这是真的吗?”Jim Fan甚至怀疑这是由AI视频生成工具Sora生成的。
日前,美国加利福尼亚州洛杉矶县山火随强风持续肆虐,数千座建筑物都被烧毁,其中也包括很多明星、名人的房屋。近日,网传冯小刚美国房屋及里面的藏品被加州山火烧毁。14日,冯小刚在个人社交平台发声否认:“我一直在海口拍摄,身体无恙,再者本人也无房屋被烧毁,关心我的人请勿信谣言。
1月10日深圳交警发布最新通告▼继续对非本市核发机动车号牌载客汽车在全市早晚高峰时段实施限行自2025年1月13日至2026年1月12日施行据此规定,2025年1月20日至2月12日(农历腊月廿一至正月十五元宵节),暂停限外措施,期间允许所有非深号牌小型载客汽车在深圳全市全时段通
1月11日下午,装载有超1200柜、重约2万吨智利车厘子的“马士基 萨拉特”号货轮缓缓靠泊广州南沙港二期码头。这是2024-2025智利车厘子新产季以来,广州南沙口岸单次进口量最大的一批智利车厘子,也是智利车厘子新产季广州南沙港接驳的第8艘智利“车厘子快线”。
冯小刚洛杉矶房屋被烧毁,不计其数的藏品付之一炬?本人回应:一直在海口拍摄,也无房屋被烧毁
日前,美国加利福尼亚州洛杉矶县山火随强风持续肆虐,数千座建筑物都被烧毁,其中也包括很多明星、名人的房屋。随后,有不少网友发文称,知名导演冯小刚等中国明星在洛杉矶的房屋也在这场大火中被烧毁,冯小刚不计其数的藏品付之一炬。
前券商首席经济学家李大霄在接受南都湾财社记者正常采访时表示,2025年,股票市场可能由政策驱动转变为“政策+业绩”双驱动,从此前急剧上升的脉冲式行情转变为稳步缓慢回升的“慢牛”格局。
1月14号河北唐山,因为冰面坍塌,钓鱼者集体落水,情况相当混乱,这群人为了钓鱼,不惜以身涉险,集体踩在薄薄的冰面上。有一部分人没有落水,拼命往回走,可是冰面太滑,根本走不快,即使到了命悬一线的时刻,他们也不忍心抛弃鱼竿。
大家好,我是 “超级编程”。程序员一枚,热爱代码。分享编程技巧与技术动态,带你畅游代码世界,一起成长,开启编程之旅。