资讯 - 第257页

发现科技资讯

排序

发布更新浏览点赞

可灵2.5 Turbo – 可灵推出的最新AI视频生成模型，适合多种风格的视频创作。

可灵AI推出视频生成可灵2.5 Turbo模型，同步更新文生视频、图生视频两大功能。可灵 2.5 Turbo 最核心的突破在于文本理解能力的代际升级。与仅能处理简单指令的 2.1 版本不同，新模型可深...

发现资讯

9个月前

07420

Coral NPU – 谷歌推出的全栈开源AI平台，高效执行机器学习（ML）模型的推理任务

谷歌正式推出 Coral NPU，一个面向边缘人工智能（Edge AI）的开源全栈平台。旨在解决性能、碎片化和隐私这三大核心挑战，而这些挑战限制了功能强大、始终在线的 AI 技术在低功耗边缘设备和可穿...

发现资讯

7个月前

07410

MiMo-V2-Flash – 小米开源的高性能语言模型，生成速度提升2倍

mimo-v2-flash 是小米推出的开源高性能大语言模型，整体参数量达3090亿，其中每轮推理激活参数为150亿。仅用了309B的参数规模，该模型就展现出了极高的效能密度，在多项权威综合评测中均取...

发现资讯

6个月前

07400

Mixboard – 谷歌推出的AI画板工具，快速将想法可视化

谷歌推出实验性 AI 工具 Mixboard，该工具由Banana提供支持，号称能把任何想法都即时可视化。主打“开放画布”与生成式 AI 创意，可从文本提示或预制板开始，生成包括家居装饰、产品设计等多...

发现资讯

9个月前

07390

TalkCody – 开源AI编程助手，涵盖 50 多种主流 AI 模型，支持多模态输入

talkcody 是一款开源的 ai 编程助手，旨在提升开发者在软件开发过程中的效率。支持Ollama离线模型和自定义提示，将复杂调试化繁为简。采用 Rust 和 Tauri 构建，具备原生性能和低资...

发现资讯

6个月前

07380

GLM-TTS – 智谱开源的AI文本转语音模型，支持多种方言和特殊语音的合成

智谱正式发布工业级语音合成系统 GLM-TTS，只需录音3秒，或者上传3秒-10秒的录音文件，即可快速克隆你自己的声音。在通用朗读、情感配音、教育评测、电子书、有声客服等场景中，实现自然流畅、贴近真人...

发现资讯

6个月前

07370

WebWeaver – 阿里通义开源的双Agent框架，提高研究效率和质量

WebWalker是阿里巴巴通义实验室提出的一个用于提升大型语言模型（LLM）网页信息检索能力的框架，它是一个基于阿里通义大模型（通义千问）的开源框架，旨在通过对话式AI助手（Agent）来提升用户与...

发现资讯

9个月前

07370

混元3D-Omni – 腾讯混元推出的3D资产生成框架，能够生成高精度的3D模型

腾讯混元团队推出了混元 3D-Omni，一个基于 Hunyuan3D 2.1 构建的统一多模态可控 3D 生成框架。该框架不仅支持图像作为输入，还可接受点云、体素、边界框与骨骼姿态等多种控制信号，支持...

发现资讯

8个月前

07360

Mano – 明略科技推出的GUI智能操作模型，为自动化操作提供高效解决方案

mano 是由明略科技研发的专用大模型，专注于图形用户界面（gui）的智能化操作。该模型建立在多模态基础架构之上，融合了在线强化学习与自动化训练数据采集等前沿技术。Mano的创新，不单单是解决了目前的...

发现资讯

8个月前

07350

Androidify – 谷歌开源的如何构建AI Android应用项目，创建个性化安卓机器人

Androidify是谷歌推出的一项开源计划，旨在帮助开发者深入了解如何在 android 平台上打造由人工智能驱动的应用程序。用户可以通过上传个人照片或输入文字描述，生成专属的安卓机器人形象，并自由...

发现资讯

8个月前

07330

加载更多