华为晟腾DeepSeek模型部署实践 1 环境准备推荐参考配置如下,部署DeepSeek-V3/R1量化模型至少需要多节点Atlas 800I A2(8*64G)服务器。本方案以DeepSeek-R1为主进行介绍,DeepSeek-V3与R1的模型结构和参数量一致,部署方式与R1相同。 2 免责说明本博客的部分内容来源于互联网公开资料,包括但不限于文章、图片、视频、音频等素材。这些素材的版权归原作者或版权持有人所有。本博 2025-02-26 运维开发 #DeepSeek #LLM
站内信、活动、公告和推送技术调研 1 需求分析 帮我调研下 web 系统的站内信、活动、公告和推送的设计实现解决方案 站内信的核心抽象:消息内容、消息和发送人的关系、是否已读。 2 理论设计【xxx】【点赞】了你的【文章】【文章的标题】【xxx】【评论】了你的【文章】【文章的标题】【xxx】【点赞】了你在【文章】【文章的标题】下的评论【xxx】【回复】了你的【评论】【被回复的评论的内容】【xxx】【点赞】了你在【文章】【文 2025-02-11 后端开发 #后端 #消息推送
开发踩坑日记 1 MySQL tinyInt 类型字段的长度最好设置为业务值域的最大值,否则可能出现事务回滚导致的类型转换错误(整形的值被回滚更新为布尔类型),具体原理需要进一步排查。 2024-11-17 后端开发 #Java #Mysql
Large Language Models for Generative Information Extraction A Survey Large Language Models for Generative Information Extraction A Survey汇报人:范财胜所属单位:武汉理工大学汇报时间:2024-06-10 18:51:45联系方式:alleyf@qq.com 2024-06-10 科研学习 #科研