可灵2.5 Turbo – 可灵推出的最新AI视频生成模型,适合多种风格的视频创作。可灵AI推出视频生成可灵2.5 Turbo模型,同步更新文生视频、图生视频两大功能。可灵 2.5 Turbo 最核心的突破在于文本理解能力的代际升级。与仅能处理简单指令的 2.1 版本不同,新模型可深...发现资讯7个月前07310
Mixboard – 谷歌推出的AI画板工具,快速将想法可视化谷歌推出实验性 AI 工具 Mixboard,该工具由Banana提供支持,号称能把任何想法都即时可视化。主打“开放画布”与生成式 AI 创意,可从文本提示或预制板开始,生成包括家居装饰、产品设计等多...发现资讯7个月前07300
WebWeaver – 阿里通义开源的双Agent框架,提高研究效率和质量WebWalker是阿里巴巴通义实验室提出的一个用于提升大型语言模型(LLM)网页信息检索能力的框架,它是一个基于阿里通义大模型(通义千问)的开源框架,旨在通过对话式AI助手(Agent)来提升用户与...发现资讯7个月前07270
Molmo 2 – Ai2开源的AI视频分析模型,提供灵活的多模态处理能力艾伦人工智能研究所(Ai2)发布了全新的 Molmo2开源视频语言模型,支持多图像.视频输入,能推理事件、生成字幕并追踪物体。模型基于 Qwen 3 和 Olmo 架构,具备强大的视频分析能力,能在视...发现资讯4个月前07260
Mano – 明略科技推出的GUI智能操作模型,为自动化操作提供高效解决方案mano 是由明略科技研发的专用大模型,专注于图形用户界面(gui)的智能化操作。该模型建立在多模态基础架构之上,融合了在线强化学习与自动化训练数据采集等前沿技术。Mano的创新,不单单是解决了目前的...发现资讯7个月前07260
Androidify – 谷歌开源的如何构建AI Android应用项目,创建个性化安卓机器人Androidify是谷歌推出的一项开源计划,旨在帮助开发者深入了解如何在 android 平台上打造由人工智能驱动的应用程序。用户可以通过上传个人照片或输入文字描述,生成专属的安卓机器人形象,并自由...发现资讯7个月前07250
混元3D-Omni – 腾讯混元推出的3D资产生成框架,能够生成高精度的3D模型腾讯混元团队推出了混元 3D-Omni,一个基于 Hunyuan3D 2.1 构建的统一多模态可控 3D 生成框架。该框架不仅支持图像作为输入,还可接受点云、体素、边界框与骨骼姿态等多种控制信号,支持...发现资讯7个月前07250
Stand-In – 腾讯微信推出的视频生成框架,支持生成具有高保真度的文本内容腾讯发布了一个全新的开源项目——Stand-In,它是一个轻量级、即插即用的身份保留视频生成框架,不仅支持生成具有高保真度的文本到视频(Text-to-Video,T2V)内容,还能进行换脸、姿态控制...发现资讯8个月前07240
可灵2.6 – 快手可灵推出音画同出的AI视频生成模型,支模型持文生音画和图生音画两种模式可灵推出视频生成2.6模型,该模型提供了里程碑式的“音画同出”能力,彻底改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程,用户仅需输入一段文字或一张图片,即可自动产出融合自然语音、精准音...发现资讯5个月前07230
Infography – 自动将文本内容转化可视化图表生成平台Infography是一款由专业团队开发的AI工具,能将复杂的数据或文本内容转化为直观的视觉呈现,主要面向市场营销人员、产品经理、教育工作者以及任何需要将复杂信息以视觉化方式呈现的用户。Infogra...发现资讯5个月前07220