GitHub推出–Agent HQ 集成AI智能体平台,助你快速打造专业级智能体GitHub 推出Agent HQ,将 AI 编程助手彻底整合进平台,让开发者能像管理团队一样指挥多个 AI 代理。这是首款突破原生界面限制、直接嵌入编辑器的合作伙伴智能体,其核心目标是统一管理各类 ...发现资讯7个月前07590
VLAC – 上海AI实验室开源的具身奖励大模型,支持人机协作模式VLAC是上海人工智能实验室开源的具身奖励大模型,旨在解决机器人真实世界强化学习中的效率与泛化难题。VLAC模型通过数据驱动的奖励机制和多模态认知架构,初步解决了机器人真实世界学习的效率与泛化难题。其...发现资讯9个月前07580
SAIL-VL2 – 字节抖音联合国立大学开源的视觉语言模型,突破传统密集型模型的限制抖音SAIL团队与LV-NUS Lab联合推出的多模态大模型SAIL-VL2。它能高效地将视觉输入对齐到语言模型的表示空间。整个系统由三个核心部分组成:视觉编码器SAIL-ViT、视觉-语言适配器和大...发现资讯8个月前07560
Navos – 钛动科技推出的首款出海营销AI Agent,覆盖出海营销的策划、投放、数据分析等全链路钛动科技推出的Navos是全球首个营销AI Agent,专为中国品牌出海设计,整合市场洞察、创意生成、广告优化等功能,通过多智能体架构提升营销效率。Navos不只是一个通用语言模型,更是一位深谙出海营...发现资讯7个月前07550
xLLM – 京东开源的智能推理框架,实现5倍效率提升和90%成本优化京东正式开源其自研大模型推理引擎xLLM。据悉,该引擎基于国产芯片深度优化,是一款专注于大模型高效推理的基础软件。xLLM在内部多场景应用中实现的5倍效率提升和90%成本优化,已经强有力地证明了其技术...发现资讯8个月前07540
混元图像2.1 – 腾讯开源的文生图模型,支持2K分辨率的图像生成腾讯Hunyuan团队正式开源HunyuanImage2.1,该模型支持原生2048x2048分辨率输出,并显著提升文本生成能力,尤其在双语(中英)支持和复杂语义理解上表现出色。该模型增强了语义一致性...发现资讯9个月前07540
可灵O1 – 可灵AI推出全球首个统一多模态视频生成模型,轻松生成和编辑视频内容。全球首个大一统的多模态视频、图片创作工具“可灵O1”正式上线。模型通过创新的多模态视觉语言(MVL)架构,实现视频生成、编辑与理解的无缝融合。可灵O1基于全新的视频和图像模型,以自然语言作为语义骨架...发现资讯6个月前07500
Game-TARS -字节跳动推出的通用型游戏智能体,提升任务完成率和交互智能字节跳动Seed团队打造的通用型游戏智能体Game-TARS,打破了传统游戏AI的局限。Game-TARS的核心创新,就是彻底抛弃了这种定制化思路,让AI像人一样通过最底层的键盘和鼠标动作与游戏交互...发现资讯7个月前07490
Molmo 2 – Ai2开源的AI视频分析模型,提供灵活的多模态处理能力艾伦人工智能研究所(Ai2)发布了全新的 Molmo2开源视频语言模型,支持多图像.视频输入,能推理事件、生成字幕并追踪物体。模型基于 Qwen 3 和 Olmo 架构,具备强大的视频分析能力,能在视...发现资讯6个月前07440
SWE-1.5 – Cognition 推出的高性能AI编程模型,支持多轮交互式编程SWE-1.5 是由 AI 编程公司 Cognition 推出的最新高性能 AI 编程模型,其模型本身、推理过程与智能体框架经过协同设计,共同构成一个统一系统,以此同时实现高速与智能。旨在为软件工程任...发现资讯7个月前07420