AI资讯RLWRLD推出融合力觉与触觉的机器人基础模型「RLDX-1」实现高灵巧度
RLWRLD发布了集视觉、语言、力觉、触觉及作业记忆于一体的机器人基础模型RLDX-1,展示了类人机器人灵巧操作的最新成果。
按标签聚合查看文章内容。
AI资讯RLWRLD发布了集视觉、语言、力觉、触觉及作业记忆于一体的机器人基础模型RLDX-1,展示了类人机器人灵巧操作的最新成果。
AI资讯阿里巴巴通义实验室推出PrismAudio框架,解决AI视频生成中的音视频不同步问题。该技术采用“链式思维”机制,先分析视频内容,再生成匹配的音效,提升沉浸感。研究成果已被ICLR 2026录用。
AI资讯生成式AI的核心技术“LLM” LLM是“Large Language Model(大规模语言模型)”的缩写,是驱动ChatGPT、Gemini、Claude等生成式AI服务的核心技术。 这些服务并非仅由LLM构成,还结合了界面、语音输入、搜索、外部工具及安全措施等多种机制。而LLM则作为理解和生成文本的“引擎”,相当于生成式AI的“头脑”。 LLM的特点在于利用海量文本数据和强大计算资源进行训