暂无数据
暂无数据
阿里云AI技术成果亮相春晚
阿里巴巴-W(09988.HK)1月27日耗资417.27万美元回购37.2万股
杭州领跑AI开源!阿里Qwen除夕开源视觉理解新旗舰,全系列3尺寸,7B模型超GPT-4o-mini
《大行》里昂料DeepSeek有助AI应用普及货币化 利好AI设备公司如小米及瑞声
里昂发表报告表示,内地人工智能公司深度求索(DeepSeek)公布大模型,其AI模型训练是基于业界开源人形机器人-AI算法,并展现良好的效能和相对较低的训练成本。但该行认为美国超大规模企业的人工智慧资本支出,可能不会因为DeepSeek的影响而下降,因DeepSeek的人工智能模型训练总成本可能被低估,较低的运算成本也可能增加人工智能应用和推理需求,这将进一步增加运算能力需求,料行业资本支出应该持续。该行指
阿里云通义千问开源两大模型 视觉理解能力超越GPT-4o与Claude3.5
阿里云通义千问开源全新视觉模型Qwen2.5-VL及Qwen2.5-1M。当中,Qwen2.5-VL涉及3B、7B和72B三个尺寸版本,而旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,全面超越GPT-4o与Claude3.5。新的Qwen2.5-VL能够更准确地解析图像内容,突破性地支持超过一小时的视频理解,无需微调就可变身为一个能操控手机和电脑的AI视觉智能体(
国信证券:DeepSeek多层面技术提升训练效率 测试性能领跑开源模型
国信证券发表报告表示,中国人工智能公司深度求索(DeepSeek)于去年12月26日上线并开源DeepSeek-V3模型,多项评测超同类开源模型,在重要领域与顶尖闭源模型相当,训练成本低。模型层采用MoE架构,经多阶段训练与能力提炼,在知识、代码、数学推理等测评中领先开源模型。架构层沿用V2架构,引入新技术,如无辅助损失负载均衡策略、MTP提升数据利用率。训练层通过DualPipe算法和FP8混合