暂无数据
暂无数据
国信证券:DeepSeek多层面技术提升训练效率 测试性能领跑开源模型
国信证券发表报告表示,中国人工智能公司深度求索(DeepSeek)于去年12月26日上线并开源DeepSeek-V3模型,多项评测超同类开源模型,在重要领域与顶尖闭源模型相当,训练成本低。模型层采用MoE架构,经多阶段训练与能力提炼,在知识、代码、数学推理等测评中领先开源模型。架构层沿用V2架构,引入新技术,如无辅助损失负载均衡策略、MTP提升数据利用率。训练层通过DualPipe算法和FP8混合
DeepSeek发布开源多模态AI模型 以文生图测试表现据称超越OpenAI模型
内媒报道,据人工智能社区Hugging Face,深度求索(DeepSeek)发布分别名为Janus-Pro及JanusFlow的一系列开源多模态人工智能模型。DeepSeek的展示图显示,在以文生图GenEval及DPG-Bench的基准测试中,Janus-Pro-7B准确率较前代Janus提升,分别为80%及84.2%,高于OpenAI的DALL-E 3及Stable Diffusion模型。
市场动态:商汤科技将剥离医疗平台
人工智能公司商汤科技(HKG:0020)计划将其医疗健康平台SenseTime Healthcare剥离为一个新实体,《南华早报》周日报道。SenseTime Healthcare
北水爆买港股近91亿港元!今日买入腾讯近7亿港元,卖出中芯国际逾8亿港元
春节一周,什么将引发华尔街深思?
商汤-W01月27日获主力大幅加仓3.33亿元