坏消息,开源模型和闭源模型的差距越来越大了。好消息,DeepSeek 又出手了。12 月 1 日,DeepSeek 发布了两款新模型 —— DeepSeek V3.2 和 DeepSeek-V3.2-Speciale。DeepSeek的一次小更新:暴打OpenAI 追上Gemini前者和 GPT-5 能打的有...
快科技11月29日消息,年初DeepSeek R1发布之后引发了全球震撼,也让DeepSeek R1/V3等大模型在开源领域开创一片天,不过现在DeepSeek热度也下滑了,B端市场未来会被阿里的千问超越。大摩中国日前发布了一份报告,调研了企业CIO首席信息官今年下半年在B端市场的看法,报告尤其看好阿里...
在旧金山,正在运行着一个中国模型,“这可能是硅谷最大的‘不能说的秘密’。”与帕迪·科斯格雷夫(Paddy Cosgrave)刚见面,他就一面展示着他上一秒在DeepSeek上询问的问题一面解释,那些压根不做AI的公司,全在跑DeepSeek的本地化版本。“既然有它,谁还愿意掏钱去用OpenAI或Anthrop...
快科技8月25日消息,近日,深度求索宣布正式发布DeepSeek-V3.1。其中一个重大的进步和惊喜,就是支持了UE8M0 FP8。专为下一代国产芯片设计!DeepSeek采用UE8M0 FP8标准:华为积极适配 彻底和NVIDIA决裂了DeepSeek在其官宣发布DeepSeek-V3.1的文章中提到,UE...
快科技8月9日消息,近日,媒体相继披露了量化私募巨头幻方量化市场总监李橙与招商证券员工之间长达六年的利益输送细节,这一事件也揭开了去年11月“幻方量化员工因涉券商返佣被抓”传言背后的真相。要追溯这起利益输送案的源头,需从相关人员的履历和业务往来说起。据报道,李橙曾任职于招商证券,或是基于业务与人情关系,幻方量...
要问最近哪个模型最火,混合专家模型(MoE,Mixture of Experts)绝对是榜上提名的那一个。它的巧妙之处,就在于把不同的任务分配给擅长处理的专家网络,让整个系统性能得以提升。但你知道吗?正是这个关键的专家网络,也是严重影响系统推理性能的因素之一。因为在大量任务来临之际(尤其是超大规模时),MoE...
快科技3月24日消息,香港中文大学(深圳)公共政策学院院长郑永年近日接受采访时表示,随着中国转向技术原创,美西方的打压限制事实上为时已晚。“未来西方甚至可能在一些原创技术上依附于中国。美国和欧洲的资本对中国依然越来越感兴趣。这不仅源于中国的庞大市场、超过4亿的中产人群,也与中国稳定的政治环境,以及仍可观的未来...
快科技2月28日消息,在不舍与兴奋中,我们迎来了DeepSeek开源周第五天。今天DeepSeek开源的项目是:Fire-Flyer文件系统,即3FS。DeepSeek完美收官:开源劳苦功高的3FS!据了解,3FS是一个高性能并行文件系统,它是所有Deepseek数据访问的助推器,能应对AI训练和推理工作负载...
如果有人说:差评君是秦始皇,别说你了,哥们自己都不信。但要有人说:DeepSeek 是秦始皇。那咱没准还真要琢磨下,毕竟人家这段时间,真一统全国了。。。你看甭管是哪个行业的哪家公司、和 AI 有没有打过交道,平时有没有互相 Diss ,最近都跟说好了一样,抢着接入 DeepSeek 。差评君简单给你汇报下噢。...
快科技2月17日消息,日前,百度搜索宣布,为丰富更多元化的搜索体验,百度搜索将全面接入DeepSeek和文心大模型最新的深度搜索功能。与此同时,为服务广大开发者调用各类模型能力创建和调优智能体,百度文心智能体平台也宣布将全面接入DeepSeek。据悉,文心大模型深度搜索功能于2月13日上线,具备更强大的思考规...