可灵2.5 Turbo – 可灵推出的最新AI视频生成模型,适合多种风格的视频创作。可灵AI推出视频生成可灵2.5 Turbo模型,同步更新文生视频、图生视频两大功能。可灵 2.5 Turbo 最核心的突破在于文本理解能力的代际升级。与仅能处理简单指令的 2.1 版本不同,新模型可深...发现资讯9个月前07420
Coral NPU – 谷歌推出的全栈开源AI平台,高效执行机器学习(ML)模型的推理任务谷歌正式推出 Coral NPU,一个面向边缘人工智能(Edge AI)的开源全栈平台。旨在解决性能、碎片化和隐私这三大核心挑战,而这些挑战限制了功能强大、始终在线的 AI 技术在低功耗边缘设备和可穿...发现资讯7个月前07410
MiMo-V2-Flash – 小米开源的高性能语言模型,生成速度提升2倍mimo-v2-flash 是小米推出的开源高性能大语言模型,整体参数量达3090亿,其中每轮推理激活参数为150亿。仅用了309B的参数规模,该模型就展现出了极高的效能密度,在多项权威综合评测中均取...发现资讯6个月前07400
Mixboard – 谷歌推出的AI画板工具,快速将想法可视化谷歌推出实验性 AI 工具 Mixboard,该工具由Banana提供支持,号称能把任何想法都即时可视化。主打“开放画布”与生成式 AI 创意,可从文本提示或预制板开始,生成包括家居装饰、产品设计等多...发现资讯9个月前07390
TalkCody – 开源AI编程助手,涵盖 50 多种主流 AI 模型,支持多模态输入talkcody 是一款开源的 ai 编程助手,旨在提升开发者在软件开发过程中的效率。支持Ollama离线模型和自定义提示,将复杂调试化繁为简。采用 Rust 和 Tauri 构建,具备原生性能和低资...发现资讯6个月前07380
GLM-TTS – 智谱开源的AI文本转语音模型,支持多种方言和特殊语音的合成智谱正式发布工业级语音合成系统 GLM-TTS,只需录音3秒,或者上传3秒-10秒的录音文件,即可快速克隆你自己的声音。在通用朗读、情感配音、教育评测、电子书、有声客服等场景中,实现自然流畅、贴近真人...发现资讯6个月前07370
WebWeaver – 阿里通义开源的双Agent框架,提高研究效率和质量WebWalker是阿里巴巴通义实验室提出的一个用于提升大型语言模型(LLM)网页信息检索能力的框架,它是一个基于阿里通义大模型(通义千问)的开源框架,旨在通过对话式AI助手(Agent)来提升用户与...发现资讯9个月前07370
混元3D-Omni – 腾讯混元推出的3D资产生成框架,能够生成高精度的3D模型腾讯混元团队推出了混元 3D-Omni,一个基于 Hunyuan3D 2.1 构建的统一多模态可控 3D 生成框架。该框架不仅支持图像作为输入,还可接受点云、体素、边界框与骨骼姿态等多种控制信号,支持...发现资讯8个月前07360
Mano – 明略科技推出的GUI智能操作模型,为自动化操作提供高效解决方案mano 是由明略科技研发的专用大模型,专注于图形用户界面(gui)的智能化操作。该模型建立在多模态基础架构之上,融合了在线强化学习与自动化训练数据采集等前沿技术。Mano的创新,不单单是解决了目前的...发现资讯8个月前07350
Androidify – 谷歌开源的如何构建AI Android应用项目,创建个性化安卓机器人Androidify是谷歌推出的一项开源计划,旨在帮助开发者深入了解如何在 android 平台上打造由人工智能驱动的应用程序。用户可以通过上传个人照片或输入文字描述,生成专属的安卓机器人形象,并自由...发现资讯8个月前07330