LLaVA-OneVision-1.5 – EvolvingLMMS-Lab开源的多模态框架,实现跨模态的信息检索LLaVA-OneVision-1.5 是由 EvolvingLMMS-Lab 开发的全开源多模态框架,旨在通过高效训练和高质量数据实现多模态任务的高性能和低成本。该模型支持基于文本查询图像或基于图像...发现资讯7个月前06450
SceneGen – 上海交大推出的3D场景生成框架,单图到3D场景一步生成上海交通大学的研究团队推出了一种名为 SceneGen 的新颖框架,在这一领域取得了突破性进展。它以一张场景图像和图中物体的分割掩码作为输入,能够在一次前向传播中,同时生成场景内多个3D资产的几何、纹...发现资讯7个月前06450
Mini-o3 – 字节联合港大推出的视觉推理模型,支持多轮交互推理自字节跳动和香港大学的研究团队推出了 Mini-o3,一个旨在复现OpenAI强大但未公开的o3模型能力的开源系统。Mini-o3的核心目标是扩展模型与工具的交互能力,使其能够执行长达数十步的深度推理...发现资讯7个月前06450
LensGo AI – AI内容创作平台,无需专业剪辑技能,满足多样化创作需求随着科技的飞速发展,越来越多的技术工具涌现出来,LensGo凭借其强大的功能和简洁的操作界面,受到了广大用户的青睐。用户可以轻松实现图像的编辑、优化、分享等操作,提升工作效率和创作体验。允许用户通过简...发现资讯5个月前06440
LLaDA 2.0 – 蚂蚁集团开源的离散扩散大语言模型,比同级自回归模型快 2.1 倍蚂蚁技术研究院正式推出LLaDA2.0系列离散扩散大语言模型(dLLM),并同步公开技术报告。LLaDA2.0 包含 MoE 架构的 16B (mini) 和 100B (flash) 两个版本,打破...发现资讯5个月前06430
Workspace Studio – 谷歌推出的AI智能体构建工具,自动生成定制化 AI 智能体谷歌发布的一款 ai 驱动 自动化工具Workspace Studio,支持用户通过自然语言描述即可创建、管理和分享 AI 智能体(AI Agents)的新工具,通过自动化实现简化工作流程。支持智能任...发现资讯5个月前06420
FlowyAIPC – 本地AI办公助手工具,支持多种语言的即时翻译FlowyAIPC 是 Flowy AI 公司推出的面向智能办公领域的 AI 助手产品,这款工具能在完全离线状态下运行,所有数据、聊天记录、知识库内容都保存在本地电脑中,保证了数据的安全性和私密性。它...发现资讯4个月前06390
SpikingBrain-1.0 – 中国科学院推出的类脑脉冲大模型,能实现数量级的效率提升近日,中国科学院自动化研究所科研团队成功研发出首款类脑脉冲大模型SpikingBrain-1.0。SpikingBrain-1.0在多个性能方面实现突破:实现极低数据量高效训练、实现推理效率数量级提升...发现资讯8个月前06380
Qwen3-Omni-Flash – 阿里通义推出的全模态大模型,支持119种文本语言、19种语音识别语言和10种语音合成语言qwen3-omni-flash(qwen3-omni-flash-2025-12-01)是阿里巴巴qwen团队全新发布的全模态大语言模型。可实现文本、图像、音频和视频的无缝输入与同步输出。模型支持1...发现资讯5个月前06370
Anthropic最新推出的AI编程模型–Claude Sonnet 4.5 ,能专注工作超 30 小时Anthropic 公司推出了一款名为 Claude Sonnet 4.5 的新一代前沿模型,该模型在编码、计算机操作及满足实际业务需求方面能力更强,同时在网络安全、金融、科研等专业领域表现突出。 C...发现资讯7个月前06360