豆包大模型1.6-vision – 火山引擎推出的视觉深度思考模型,具备工具调用能力火山引擎宣布正式推出豆包大模型 1.6-vision,以工具调用的差异化能力,将图像融入其思维链中,实现对图片的定位、剪裁、点选、画线、缩放、旋转等精细处理。在增强推理可解释性的同时,可高效精准地完成...发现资讯7个月前06660
混元2.0 – 腾讯混元最新推出的智能语言模型,支持256K上下文窗口腾讯发布了自研大模型的最新版本 混元2.0(Tencent HY2.0)。包括Tencent HY 2.0 Think和Tencent HY 2.0 Instruct两个版本。该模型采用混合专家(Mo...发现资讯5个月前06650
Vidyard – AI营销视频生成平台,快速生成个性化视频与精准推送Vidyard是一款基于云的视频制作和管理平台,提供丰富的视频编辑和分析工具。内置了专为营销团队设计的转录分析工具。其核心价值在于将转写功能与观众行为分析结合,支持多语言识别,能自动生成可编辑的字幕轨...发现资讯5个月前06640
Google Skills – 谷歌推出的AI技能学习平台,支持真实代码编写和实时反馈,Google 近日推出了一个名为“Google Skills”的全新学习平台,旨在帮助用户掌握数字时代所需的核心技能。致力于弥合 AI 领域的技能鸿沟。Google Skills 平台致力于培养具备实...发现资讯6个月前06590
Hunyuan-MT-7B – 腾讯开源的轻量级翻译模型,能快速准确地完成翻译任务Hunyuan-MT-7B是什么 Hunyuan-MT-7B 是腾讯混元发布的轻量级翻译模型,参数量为70亿,支持33个语种及5种民汉语言/方言的互译,包括粤语、维吾尔语、藏语等。模型采用完整的训练范...发现资讯9个月前06590
Open Interpreter – 开源AI终端助手,支持在本地环境中运行open interpreter 是一个开源的 ai 终端助手项目,旨在为大型语言模型(llm)赋予本地代码执行能力。通过自然语言交互界面,用户可以通过类似 ChatGPT 的方式在终端中与模型对话...发现资讯3个月前06580
Seedance 1.5 Pro – 字节推出的音画同步多模态视频模型,整体效果自然流畅。字节跳动推出的Seedance 1.5 Pro模型,具备原生音画同步能力的多模态视频生成模型。该模型可实现精准音画同步,实现较高的视听一致性,且支持多种语言和地方方言口音,能够捕捉其独有的语音韵律与情...发现资讯4个月前06580
Depth Anything 3 – 字节跳动推出的视觉空间重建模型,可重建完整3D场景自字节跳动(ByteDance Seed)的研究团队推出—Depth Anything 3 (DA3)视觉空间重建模型,旨在打破3D视觉任务之间的壁垒,实现一个“大一统”的视觉几何模型。DA3的核心思...发现资讯5个月前06580
GPT-5.2-Codex – OpenAI推出的智能体编程模型,能高效生成高质量的代码gpt-5.2-codex 是 openai 推出的面向智能体编程任务的专业级模型,聚焦于高复杂度软件工程实践与防御型网络安全场景。其核心突破在于引入了“上下文压缩”技术,让其在处理代码重构、迁移等长...发现资讯4个月前06550
UnityVideo – 港科大联合可灵快手开源的视频生成框架,实现视频内容的多模态解析港科大、港中文、清华大学与快手“可灵”团队联合发布UnityVideo,一个统一多模态与多任务的视频生成框架。框架通过动态噪声注入和模态自适应学习机制,实现 RGB 视频与辅助模态之间的双向学习,加速...发现资讯5个月前06550