Mr.Alleyf
  • 首页
  • 归档
  • 分类
  • 标签
  • 画廊
  • RSS
  • Github
  • 关于
  • 友链
  •   
  •   
华为晟腾DeepSeek模型部署实践

华为晟腾DeepSeek模型部署实践

1 环境准备推荐参考配置如下,部署DeepSeek-V3/R1量化模型至少需要多节点Atlas 800I A2(8*64G)服务器。本方案以DeepSeek-R1为主进行介绍,DeepSeek-V3与R1的模型结构和参数量一致,部署方式与R1相同。 2 免责说明本博客的部分内容来源于互联网公开资料,包括但不限于文章、图片、视频、音频等素材。这些素材的版权归原作者或版权持有人所有。本博
2025-02-26
运维开发
#DeepSeek #LLM
站内信、活动、公告和推送技术调研

站内信、活动、公告和推送技术调研

1 需求分析 帮我调研下 web 系统的站内信、活动、公告和推送的设计实现解决方案 站内信的核心抽象:消息内容、消息和发送人的关系、是否已读。 2 理论设计【xxx】【点赞】了你的【文章】【文章的标题】【xxx】【评论】了你的【文章】【文章的标题】【xxx】【点赞】了你在【文章】【文章的标题】下的评论【xxx】【回复】了你的【评论】【被回复的评论的内容】【xxx】【点赞】了你在【文章】【文
2025-02-11
后端开发
#后端 #消息推送
摄影基础指南

摄影基础指南

关于摄影的基础入门知识
2025-02-09
艺术生活
#PLOG
性能测试

性能测试

性能测试的相关概念和流程。
2024-12-16
运维开发
#高并发 #高性能 #高可用
开发踩坑日记

开发踩坑日记

1 MySQL tinyInt 类型字段的长度最好设置为业务值域的最大值,否则可能出现事务回滚导致的类型转换错误(整形的值被回滚更新为布尔类型),具体原理需要进一步排查。
2024-11-17
后端开发
#Java #Mysql
研究思路

研究思路

科研思路思考
2024-08-10
科研学习
#科研 #灵感
常用软件和环境

常用软件和环境

程序员必备软件和环境配置
2024-07-05
中间件和工具
#工具
运维问题记录

运维问题记录

1 常见指令ctrl+alt:退出vcenter 1java -jar /opt/arthas/arthas-boot.jar
2024-06-27
运维开发
Large Language Models for Generative Information Extraction A Survey

Large Language Models for Generative Information Extraction A Survey

Large Language Models for Generative Information Extraction A Survey汇报人:范财胜所属单位:武汉理工大学汇报时间:2024-06-10 18:51:45联系方式:alleyf@qq.com
2024-06-10
科研学习
#科研
A survey of large language models

A survey of large language models

大语言模型综述
2024-06-09
科研学习
#科研 #大语言模型
1…34567…14

搜索

Alleyf Homepage
总访问量 次 总访客数 人
陕ICP备2022010038号 | police-icon 陕公网安备2022010038号