MOSS-TTSD – 文本到口语对话语音生成模型,支持零样本多语音克隆MOSS-TTSD 基于 Qwen3-1.7B-base 模型进行继续训练,采用离散化的语音序列建模方法,在约一百万小时单说话人语音数据和四十万小时对话语音数据上进行训练,支持中英双语的语音合成。MO...发现资讯10个月前01,0440
deepfig-AI Agent编程助手,如何让开发效率提升3倍,deepfig是一款人工智能类软件,可以满足用户在工作上的多种需求,作为互联网公司后端开发,常因重复编写CRUD接口、调试数据库索引而焦头烂额。试用过好几款AI编程工具,要么生成代码漏洞多,要么无法理...发现科技10个月前01,0420
Deepfig PPT设计引擎,5分钟生成专业级提案在分秒必争的商业世界,一份出色的演示文稿是赢得客户、打动投资人的关键。然而,精美的背后往往是市场、销售、咨询等专业人士数小时的繁琐劳作。Deepfig的出现,正是为了彻底终结这一痛点。 一、核心痛点...发现科技9个月前01,0380
Seedream 4.5 – 字节跳动推出的AI图像创作模型,精准响应复杂的文字指令字节跳动最新发布的AI图像生成模型Seedream 4.5在火山引擎上线。新模型在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代,进一步提升了图像生成的整体质量与稳定性。模型支持广...发现资讯5个月前01,0340
Hailuo 2.3 – MiniMax推出的AI视频生成模型,支持复杂肢体动作生成上海ai独角兽企业minimax稀宇极智正式推出新一代视频生成模型hailuo 2.3(海螺2.3)。该模型支持文本和图像输入生成高品质视频,标志着AI在动态视觉效果上的又一突破,尤其适用于电影制作...发现资讯6个月前01,0320
聆音EchoCare – 香港中科院推出的超声大模型,有效提升医疗服务效率中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)在香港正式开源发布其最新科研成果——EchoCare“聆音”超声基座大模型(简称“聆音”),通过超过450余万张大规模多器官、多中心、多地区...发现资讯7个月前01,0280
MobileCLIP2 – 苹果开源的端侧多模态模型,提高模型对不同模态数据的适应性苹果公司的研究人员最近推出了 MobileCLIP2,该模型在GitHub和Hugging Face上进行了开源,提供了预训练权重和数据生成代码,以供开发者使用。MobileCLIP2通过改进多模态增...发现资讯8个月前01,0280
AI-Trader – 港大开源的AI自动交易竞赛框架,探索 ai 的投资能力ai-trader 是香港大学推出的开源 ai 交易框架,能让不同的 ai 模型在真实市场环境中自主交易,探索 ai 的投资能力。框架支持多模型竞争,集成市场数据和新闻搜索,提供实时交易监控和历史回放...发现6个月前01,0270
Grok Code Fast 1 – xAI推出的AI编程模型,快速生成代码grok-code-fast-1是马斯克旗下xAI公司发布的专门用于编程的AI模型,被称为"快速且经济的推理模型"。它属于智能体类型,能够在无需大量人工监督的情况下处理编程任务,主打高速开发体验。Gr...发现资讯8个月前01,0270
behance官网网址(设计神器网页版入口)behance是一款设计神器,是设计师、艺术家们常用的平台,也是他们展示以及寻找灵感的地方,这里拥有丰富的设计素材,方便大家学习他人的创作,也可以通过这里挖掘人才。很多用户说找不到behance官网入...发现科技10个月前01,0270