AIGC领域技术革新与融资动态：谷歌、字节跳动、OpenAI等巨头最新动作

author 2024-12-27 共11人围观，发现0个评论

近期AIGC领域技术发展日新月异，几家巨头企业纷纷发布了各自的最新成果。谷歌DeepMind发布了视频生成模型Veo 2和图像生成模型Imagen 3，据称在内部测试中超越了OpenAI的Sora，Veo 2可以生成高达4K分辨率的视频，并包含谷歌的元数据水印SynthID；Imagen 3能够更准确地呈现多样化的艺术风格。与此同时，谷歌还推出了基于Gemini 2.0 Flash开发的实验性推理模型Gemini 2.0 Flash Thinking，该模型支持32000个tokens的输入，并能够展示其推理过程，目前在LM Arena评测中排名第一。

英伟达发布了新的AI开发套件Jetson Orin Nano Super，以更低的价格提供更强大的生成式AI计算能力，其INT8运算能力达到67 TOPS。字节跳动发布了豆包视觉理解模型和豆包3D生成模型，前者价格低廉，可用于分析图表、处理代码等任务；后者需与火山引擎数字孪生平台结合使用。此外，字节跳动的豆包通用模型pro已对齐GPT-4，音乐模型和文生图模型也进行了升级。

OpenAI正式发布了o1模型的API，并大幅下调了服务费用，同时还推出了电话服务功能，让座机/老人机用户也能使用ChatGPT。此外，OpenAI还增加了偏好微调功能，采用直接偏好优化(DPO)技术。国内自动驾驶技术公司图森未来更名为CreateAI，并发布了首个开源图生视频大模型产品“Ruyi”。国内大模型独角兽智谱宣布完成新一轮30亿元融资，将用于基座大模型的研发升级。AI搜索引擎公司Perplexity完成5亿美元融资，估值达到90亿美元，并收购了专注于检索增强生成（RAG）技术的初创公司Carbon。