AI模型相关知识
摘要
本文主要介绍AI模型相关知识,包括AI模型相关技术、AI模型相关工具、AI模型相关应用等。
一些概念
模型的泛化能力:模型举一反三的能力,即模型在测试集数据时的表现,而不是训练时数据的表现
大模型的幻觉问题:上下文矛盾问题、与prompt要求不一致、与事实矛盾(编造事实)、与常识矛盾(常识)
产生幻觉的原因:数据质量问题(不准确的信息、缺乏多样性),大模型训练的过拟合(泛化能力弱),推理过程,提升工程(给模型的prompt不够好)
大模型分类
📝 自然语言处理模型(NLP):文本分类、命名实体识别、问答、语言建模、摘要、翻译、多项选择和文本生成。Transformer、BERT
机器视觉(computer vision):图像分类、目标检测和语义分割。CNN、ResNe...
AI-infra
摘要
AI智算中心的相关知识点
GPU服务器
HGX与DGX的区别:HGX是服务器中的GPU模块例如HGX H100则是包含8块H100的模块,DGX server则是包括GPU、内存、网卡、硬盘和HGX模块的AI服务器
GPU
网络
NVIDIA Mellanox SHARP
存储
此处为引用,没有准确说明计算原理:
以OpenAI为例,进行样本数据量的分析。GPT2是40GB、GPT3是45TB、GPT4的量级预计达到了数百TB甚至PB级,对存储的空间也带来巨大挑战。
在checkpoint和模型文件部分:以GPT4为例,Checkpoint 数据大小约为5-8TB,模型大小约为2.8TB,按照常规的每四个小时保存一次,90天的训练周期,保存15%的比...
K8S集群搭建
摘要
基于CentOS7.9系统搭建
搭建K8S
安装kubeadm
使用国内aliyun源
cat <<EOF > /etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kube...
45 post articles, 6 pages.