Home

AI模型相关知识

摘要 本文主要介绍AI模型相关知识,包括AI模型相关技术、AI模型相关工具、AI模型相关应用等。 一些概念 模型的泛化能力:模型举一反三的能力,即模型在测试集数据时的表现,而不是训练时数据的表现 大模型的幻觉问题:上下文矛盾问题、与prompt要求不一致、与事实矛盾(编造事实)、与常识矛盾(常识) 产生幻觉的原因:数据质量问题(不准确的信息、缺乏多样性),大模型训练的过拟合(泛化能力弱),推理过程,提升工程(给模型的prompt不够好) 大模型分类 📝 自然语言处理模型(NLP):文本分类、命名实体识别、问答、语言建模、摘要、翻译、多项选择和文本生成。Transformer、BERT 机器视觉(computer vision):图像分类、目标检测和语义分割。CNN、ResNe...

Read more

B端产品经理入门

摘要 产品经理需要关注的6点: 行业与市场分析 需求调研与挖掘 产品商业模式设计 产品架构设计 产品与运营打法 规划里程碑设定 竞品分析 找到竞品:通过app store,google play,github等渠道寻找 收集基础数据:竞品名称、版本号、优缺点等 输出竞品分析报告: 市场竞争环境:市场现状、市场规模、用户规模、未来趋势 基础数据分析:同类产品 竞品分类分析:产品模式、盈利方式 筛选核心竞品:核心竞品原因 核心竞品分析:产品定位、目标人群、盈利模式 总结和思考

Read more

AI-infra

摘要 AI智算中心的相关知识点 GPU服务器 HGX与DGX的区别:HGX是服务器中的GPU模块例如HGX H100则是包含8块H100的模块,DGX server则是包括GPU、内存、网卡、硬盘和HGX模块的AI服务器 GPU 网络 NVIDIA Mellanox SHARP 存储 此处为引用,没有准确说明计算原理: 以OpenAI为例,进行样本数据量的分析。GPT2是40GB、GPT3是45TB、GPT4的量级预计达到了数百TB甚至PB级,对存储的空间也带来巨大挑战。 在checkpoint和模型文件部分:以GPT4为例,Checkpoint 数据大小约为5-8TB,模型大小约为2.8TB,按照常规的每四个小时保存一次,90天的训练周期,保存15%的比...

Read more

K8S集群搭建

摘要 基于CentOS7.9系统搭建 搭建K8S 安装kubeadm 使用国内aliyun源 cat <<EOF > /etc/yum.repos.d/kubernetes.repo [kubernetes] name=Kubernetes baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/ enabled=1 gpgcheck=1 repo_gpgcheck=1 gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kube...

Read more