发现 - 第12页

发现科技资讯

排序

发布更新浏览点赞

MOSS-TTSD – 文本到口语对话语音生成模型，支持零样本多语音克隆

MOSS-TTSD 基于 Qwen3-1.7B-base 模型进行继续训练，采用离散化的语音序列建模方法，在约一百万小时单说话人语音数据和四十万小时对话语音数据上进行训练，支持中英双语的语音合成。MO...

发现资讯

12个月前

01,0560

Hailuo 2.3 – MiniMax推出的AI视频生成模型，支持复杂肢体动作生成

上海ai独角兽企业minimax稀宇极智正式推出新一代视频生成模型hailuo 2.3（海螺2.3）。该模型支持文本和图像输入生成高品质视频，标志着AI在动态视觉效果上的又一突破，尤其适用于电影制作...

发现资讯

8个月前

01,0550

Deepfig PPT设计引擎，5分钟生成专业级提案

在分秒必争的商业世界，一份出色的演示文稿是赢得客户、打动投资人的关键。然而，精美的背后往往是市场、销售、咨询等专业人士数小时的繁琐劳作。Deepfig的出现，正是为了彻底终结这一痛点。一、核心痛点...

发现科技

11个月前

01,0540

deepfig-AI Agent编程助手，如何让开发效率提升3倍，

deepfig是一款人工智能类软件，可以满足用户在工作上的多种需求，作为互联网公司后端开发，常因重复编写CRUD接口、调试数据库索引而焦头烂额。试用过好几款AI编程工具，要么生成代码漏洞多，要么无法理...

发现科技

12个月前

01,0530

behance官网网址（设计神器网页版入口）

behance是一款设计神器，是设计师、艺术家们常用的平台，也是他们展示以及寻找灵感的地方，这里拥有丰富的设计素材，方便大家学习他人的创作，也可以通过这里挖掘人才。很多用户说找不到behance官网入...

发现科技

1年前

01,0480

Seedream 4.5 – 字节跳动推出的AI图像创作模型，精准响应复杂的文字指令

字节跳动最新发布的AI图像生成模型Seedream 4.5在火山引擎上线。新模型在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代，进一步提升了图像生成的整体质量与稳定性。模型支持广...

发现资讯

7个月前

01,0450

聆音EchoCare – 香港中科院推出的超声大模型，有效提升医疗服务效率

中国科学院香港创新研究院人工智能与机器人创新中心（CAIR）在香港正式开源发布其最新科研成果——EchoCare“聆音”超声基座大模型（简称“聆音”），通过超过450余万张大规模多器官、多中心、多地区...

发现资讯

9个月前

01,0410

Grok Code Fast 1 – xAI推出的AI编程模型，快速生成代码

grok-code-fast-1是马斯克旗下xAI公司发布的专门用于编程的AI模型，被称为"快速且经济的推理模型"。它属于智能体类型，能够在无需大量人工监督的情况下处理编程任务，主打高速开发体验。Gr...

发现资讯

10个月前

01,0400

MobileCLIP2 – 苹果开源的端侧多模态模型，提高模型对不同模态数据的适应性

苹果公司的研究人员最近推出了 MobileCLIP2，该模型在GitHub和Hugging Face上进行了开源，提供了预训练权重和数据生成代码，以供开发者使用。MobileCLIP2通过改进多模态增...

发现资讯

10个月前

01,0390

Sonic-3 – Cartesia推出的实时语音对话模型，支持多种语言的自然语音输出

Cartesia 公司推出新一代实时对话文本转语音模型 Sonic-3，该模型基于 State Space Model（SSM）架构打造，推理延迟低至 90 毫秒，端到端响应仅需 190 毫秒，是最快...

发现资讯

8个月前

01,0370

加载更多