刘晖老师的内训课程
第一部分:海外大模型:科技巨头自主研发,积极联盟AI 初创公司如何形成“数据模型应用”的飞轮是AI 大模型企业成功关键微软OpenAI 领先,谷歌追赶,Meta 防御性开源,英伟达转型算力云服务.科技巨头正通过其云计算部门,积极寻求与AI 初创公司的合作OpenAI:全球领先的AI 初创企业发展历程:从非营利开端到向营利性全面转型团队:年轻、背景豪华且高度聚焦技术算力:强大的算力支撑GPT 释放大模型潜能模型:坚持GPT 技术路径,持续探索生成式AI 潜力应用:以产品为导向形成数据飞轮,逐步构建生态圈谷歌:LLM 领域的奠基者发展历程:从AI 技术研发的领军者到产业化进程的推动者团队:Goog
刘晖查看详情
一·课纲 0.5天AI 大模型对通信行业拉动几何?光模块交换机:新一轮流量应用革命开启第一大变量:服务器网卡数量剧增第二大变量:数据中心网络架构变革光模块展望:23 年呈现前低后高,24 年或全面爆发数通新平台导入在即,产业升级逻辑清晰交换机:数通需求驱动增长,新一代交换芯片蓄势待发AI 服务器:量价齐升,国产崛起大模型算力需求大,AI 服务器量价齐升效应显著海外制裁有望加速国产AI 服务器快速崛起IDC 及配套设备:算力底座,新方案加速渗透运营商:算力网络主导者,对内提效对外赋能二、授课方式理论讲授:通过讲解和演示,使学员掌握课程内容;实践操作:提供实际操作和实践的机会,使学员能够亲自动
刘晖查看详情
一、课纲 2天01生成式AI的算力需求与挑战02生成式AI的算力服务器开发背景03生成式AI的算力服务器发展历程04生成式AI的算力服务器设计指南4.1 设计原则4.1.1 应用导向原则4.1.2 多元开放原则4.1.3 绿色高效原则4.1.4 统筹设计原则4.2 设计指南4.2.1 多维协同设计节点层面:(1)系统架构(2)OAM模块(3)UBB基板(4)硬件设计(5)散热设计(6)系统管理(7)故障诊断(8)软件平台集群层面:(1)集群网络与存储(2)整机柜(3)液冷(4)制冷(5)运维4.2.2 全面系统测试(1)结构测试(2)散热测试(3)稳定性测试(4)软件兼容性测试4.2.3
刘晖查看详情
AI 大模型需要什么样的数据一、课纲 1天第一章 AI 大模型需要什么样的数据集数据将是未来AI 大模型竞争的关键要素数据集如何产生他山之石#1:海外主要大语言模型数据集数据集#1:维基百科数据集#2:书籍数据集#3:期刊数据集#4:WebText(来自Reddit 链接)数据集#5:Common crawl/C4 其他数据集他山之石#2:海外主要多模态数据集类别#1:语音+文本类别#2:图像+文本类别#3:视频+图像+文本类别#4:图像+语音+文本类别#5:视频+语音+文本他山之石#3:海外主要大模型数据集由何方发布高质量语言数据和图像数据或将耗尽,合成数据有望生成大模型数据第二章 数字
刘晖查看详情
模块一:从AlphaGo到ChatGPT人工智能出现和发展的大背景第四次工业革命的特征和要求人工智能的本质:从人类的脑力工作与相应的智能说起从早期人工智能算法到机器学习,到人工神经网络和深度学习,为什么?从分析式AI到生成式AI,从“偏科专才”到“通才”通用人工智能的曙光:GPT为何如此令人兴奋?为什么通用人工智能曙光率先在自然语言处理领域展现?ChatGPT的根基: Transformer的基本核心原理大模型如何理解“词”—— 自然语言的“向量化”注意力机制 奠定生成式AI基调的核心机制Transformer: 通过“智力”和“语言能力”的压缩抽取,对输入进行“变形”ChatGPT的独到
刘晖查看详情
教学计划1数据科学 3天编程语言Python科学计算numpy数据分析pandas数据可视化matplotlib,seaborn2机器学习和数据挖掘6天机器学习基础线性回归逻辑回归KNN决策树集成学习(随机森林等)聚类特征工程XGboost推荐系统3竞赛题分析 2天竞赛案例分析(1)竞赛案例分析(2)课程时间学习期限: 11天课程安排日期主题内容Day1上午Python复习人工智能基本概念数据科学基本概念开发环境的安装配置标识符输入、输出和格式化单行注释和文档注释基础数据类型和类型转换运算符条件控制语句循环控制语句Google的编程规范组合数据类型列表、元组、集合、字典、字符串、Range函数




