2024年4月,Meta推出了其最新的开源大型语言模型Llama 3,其中Llama 3 8B和Llama 3 70B为同规模模型设定了新的标准。不过,仅三个月后,其他几款语言模型就超过了它们的性能。现在,Meta正在训练更大的Llama 3模型,该模型预计将拥有超过4000亿个参数。
最近,Reddit社区LocalLLaMA泄露了一些关于即将推出的Llama 3.1系列模型(8B、70B和405B)的早期基准测试数据。这些泄露的数据表明,Llama 3.1 405B在多个关键的AI基准测试中表现优于OpenAI的GPT-4,这对于开源AI社区来说是一个重要的里程碑。
Meta在其Llama 3发布会中强调了对开放AI生态系统的承诺,认为开放性能够促进更好的产品发展、加快创新速度,并有利于整个市场的健康发展。
根据泄露的基准测试,Llama 3.1在GSM8K、Hellaswag、boolq、MMLU-humanities、MMLU-other、MMLU-stem和winograd等多个测试中超过了GPT-4。不过,在HumanEval和MMLU-social sciences方面表现略逊一筹。
值得注意的是,这些结果来自Llama 3.1的基础模型,而通过指令微调(instruct tuning),模型的表现可能会进一步提升。
尽管OpenAI即将发布的GPT-5可能会再次挑战Llama 3.1的地位,但Llama 3.1目前的表现展示了开源AI开发的强大潜力。这可能会加速AI技术的发展,并使其更加普及。
另一方面,有关苹果公司可能推出名为Apple Intelligence的新服务的消息也引起了关注。分析师预测,这项服务可能会以每月高达20美元的价格向用户开放,反映了人工智能技术研发的高昂成本。
苹果已经有一个包含多种服务的综合套餐Apple One,其月费为19.95美元。分析师认为,苹果可能会为Apple Intelligence的高级功能额外收费10至20美元,并考虑将其整合到Apple One中。
如果这一计划实现,将意味着苹果在人工智能领域的进一步扩张,同时也为用户提供了更多高级和个性化的AI服务选项。不过,这些信息目前还未得到苹果官方的正式确认。