登陆

AIGC领域技术革新与融资动态:谷歌、字节跳动、OpenAI等巨头最新动作

author 2024-12-27 11人围观 ,发现0个评论

近期AIGC领域技术发展日新月异,几家巨头企业纷纷发布了各自的最新成果。谷歌DeepMind发布了视频生成模型Veo 2和图像生成模型Imagen 3,据称在内部测试中超越了OpenAI的Sora,Veo 2可以生成高达4K分辨率的视频,并包含谷歌的元数据水印SynthID;Imagen 3能够更准确地呈现多样化的艺术风格。与此同时,谷歌还推出了基于Gemini 2.0 Flash开发的实验性推理模型Gemini 2.0 Flash Thinking,该模型支持32000个tokens的输入,并能够展示其推理过程,目前在LM Arena评测中排名第一。

英伟达发布了新的AI开发套件Jetson Orin Nano Super,以更低的价格提供更强大的生成式AI计算能力,其INT8运算能力达到67 TOPS。字节跳动发布了豆包视觉理解模型和豆包3D生成模型,前者价格低廉,可用于分析图表、处理代码等任务;后者需与火山引擎数字孪生平台结合使用。此外,字节跳动的豆包通用模型pro已对齐GPT-4,音乐模型和文生图模型也进行了升级。

OpenAI正式发布了o1模型的API,并大幅下调了服务费用,同时还推出了电话服务功能,让座机/老人机用户也能使用ChatGPT。此外,OpenAI还增加了偏好微调功能,采用直接偏好优化(DPO)技术。国内自动驾驶技术公司图森未来更名为CreateAI,并发布了首个开源图生视频大模型产品“Ruyi”。国内大模型独角兽智谱宣布完成新一轮30亿元融资,将用于基座大模型的研发升级。AI搜索引擎公司Perplexity完成5亿美元融资,估值达到90亿美元,并收购了专注于检索增强生成(RAG)技术的初创公司Carbon。

    请发表您的评论
    Powered By hgmind.com