人工智能(artificial intelligence,AI)
指由人制造出来的机器所表现出来的智能。通常人工智能是指通过计算机系统使用数学和逻辑来模拟人类用于学习新信息并进行决策的推理过程。
介绍
- 预计 2030 预计达到 13 万亿美元规模,主要对零售、自动驾驶、预测等
- AI 可以做什么:Anything you can do with 1 second of thought, we can probably now or soon automate.
- spam filtering
- speech recognition
- machine translation
- online advertising
- Self-driving car
- visual inspection
- 哪些容易实现
- Learning a simple concept
- Lots of data available
- 分类
机器学习(Machine Learning)
:输入 A -> 输出 B 的过程
- Field of study that gives computers the ability to learn without being explicitly programmed (Arthur Samuel, 1959)
- 使计算机无需明确编程就能学习的研究领域
数据科学(Data science)
- science of extracting knowledge and insights from data
- 从数据中提取知识和见解的科学
神经网络(Artificial Neural Network,ANN,人工神经网络)
- 一种人工智能方法,用于教计算机以受人脑启发的方式处理数据
- 这种
机器学习(Machine Learning)
过程,也称为深度学习(Deep learning)
,它使用类似于人脑的分层结构中的互连节点或神经元(neuron)
无监督学习(unsupervised learning)
强化学习 reinforcement learning
图形建模 Graphical models
计划 planning
知识图表 knowledge graph
NLP(Natural Language Processing, 自然语言处理)
是人工智能和语言学领域的分支学科,主要探讨如何处理及运用自然语言;自然语言处理包括多方面和步骤,基本有认知、理解、生成等部分。
- 关系
- AI > ML > DL/NN
数据科学(Data science)
会交叉 AI、ML、DL/NN 等
- 数据集越大,神经网络(small/medium/large neural net)规模越大,效果约好
- 按功能分
- 根据数据和过去的经验做出决策(A -> B)
- 识别异常时间
- 解释视觉输入
- 对话和交流
- 语义推理
- 团队
- ML 项目可以组建内部团队,也可以外包
- DS 项目几乎都组建内部团队
四个主要组成部分
- 专家系统:作为专家处理正在审查的情况,并产生预期或预期的绩效
- 启发式问题解决:包括评估小范围的解决方案,并可能涉及一些猜测,以找到接近最佳的解决方案
- 自然语言处理:在自然语言中实现人机之间的交流
- 计算机视觉:自动生成识别形状和功能的能力
三要素
算法:深度学习框架
AI 算力训练框架:
- TensorFlow:一个开源软件库,用于各种感知和语言理解任务的机器学习。
- TensorBoard
Caffe
(快速特征嵌入的卷积结构,Convolutional Architecture for Fast Feature Embedding
)是一个深度学习框架,最初开发于加利福尼亚大学柏克莱分校。Caffe 在 BSD 许可下开源,使用 C++编写,带有 Python 接口。
- CNTK
- PyTorch 是一个开源的 Python 机器学习库,基于 Torch,底层由 C++实现,应用于人工智能领域,如自然语言处理。PyTorch 主要有两大特征:类似于 NumPy 的张量计算,可使用 GPU 加速
- 百度飞桨PaddlePaddle致力于让深度学习技术的创新与应用更简单。具有以下特点:同时支持动态图和静态图,兼顾灵活性和效率;精选应用效果最佳算法模型并提供官方支持;真正源于产业实践,提供业界最强的超大规模并行深度学习能力;推理引擎一体化设计,提供训练到多端推理的无缝对接;唯一提供系统化技术服务与支持的深度学习平台。
- AIStation 是浪潮面向人工智能企业训练场景的人工智能开发资源平台,可实现容器化部署、可视化开发、集中化管理等,为用户提供极致高性能的 AI 计算资源,实现高效的计算力支撑、精准的资源管理和调度、敏捷的数据整合及加速、流程化的 AI 场景及业务整合,有效打通开发环境、计算资源与数据资源,提升开发效率。
- OpenPAI 是一个提供完整的人工智能模型训练和资源管理能力开源平台,它易于扩展,支持各种规模的
on-premise
、on-cloud
和混合环境。
- Keras:一个用 Python 编写的开源神经网络库,能够在 TensorFlow、Microsoft Cognitive Toolkit、Theano 或 PlaidML 之上运行。
- MXNet
- H2O
- Scikit-learn
- R
- Weka
- poodarchu/Det3D 一个通用的三维物体检测代码
- lutzroeder/netron 神经网络、深度学习和机器学习模型的可视化工具
- foxglove/studio 机器人可视化和调试工具
- 安装:
apt install foxglove-studio
- 功能:数据仿真、在线连接、各种面板(如表格、参数、日志、话题发布、三维面板、主题图面板、图表)
- 同类工具
plotjuggler
、rviz
- foxglove/mcap 是一种模块化、高性能且与序列化无关的容器文件格式,适用于发布/订阅和机器人应用程序
点云(Pointcloud)
是空间中点的数据集,可以表示三维形状或对象,通常由三维扫描仪获取。点云中每个点的位置都由一组笛卡尔坐标描述,有些可能含有色彩信息或物体反射面强度信息。参考:https://point.cloud/
算力
按资源位置分:
- Cloud
- on-premises
- Edge(边缘计算),如自动驾驶、语音识别场景,传输数据需要消耗大量网络带宽等
CPU
CPU(Computer process, Central Processing Unit, 中央处理器)
GPU
数据集
Datasets
开发工具
- Kaggle:是一个数据建模和数据分析竞赛平台。企业和研究者可在其上发布数据,统计学者和数据挖掘专家可在其上进行竞赛以产生最好的模型。2017 年 3 月 8 日谷歌宣布收购 Kaggle。
- Arxiv(research publications)
VTube Studio
是一款 Live2D 虚拟 YouTuber 的一体化解决方案。使用 VTube Studio,可以轻松地将自己的 Live2D 模型直接加载到您的 Android 手机上(必须支持 ARCore 人脸跟踪),并使用人脸跟踪与他们合二为一
- OpenVINO 工具包是一个免费的工具包,可通过使用推理引擎将深度学习模型从框架和部署优化到英特尔硬件。该工具包有两个版本:
- 开放源代码社区支持的 OpenVINO 工具包
- 英特尔支持的英特尔 OpenVINO 工具包发行版
- 飞桨 AI Studio
- metaflow ML、AI 和数据科学框架
相关网站
转型的步骤
- 执行试点项目以获得动力(execute pilot project to gain momentum)
- 组件内部的 AI 团队(Build an in-house AI Team)
- 广泛培训 AI(Provide broad AI training)
- 制定 AI 策略(Develop an AI strategy)
- 发展内部和外部的沟通(Develop internal an external communications)
学习路线
以吴恩达人工智能课:
- AI For Everyone(Coursera)
- Machine Learning(Coursera)
- CS229 Machine Learning(stanford)
- 深度学习专项课程(Deeplearning.ai)
- CS230 Deep Learning(stanford)
- TensorFlow in Pratice(Deeplearning.ai)
- TensorFlow: Data and Deployment(Deeplearning.ai)
实现
-
Attention Is All You Need
-
Alpaca 模型
-
Claude
-
PALM 模型:google 为 Google Workspace 开发 AI 模型,有 540Billion 参数
-
LLaMA(Large Language Models)
模型 有 65Billion 的参数
-
MMLab 是最早把深度学习应用于计算机视觉的研究机构之一
- OpenMMlab 深度学习时代最完整的计算机视觉开源算法体系
- OpenMMLab 构建了深度学习时代最具影响力的开源计算机视觉算法系统。其目标是
- 提供高质量的库,降低算法重新实现的难度
- 创建针对各种后端和设备的高效部署工具链
- 为计算机视觉研究与开发奠定坚实基础
- 利用全栈工具链缩小学术研究与工业应用之间的差距
- 开源项目
-
PEWFT(Parameter-Efficient Fine-Tuning)
最先进的参数高效微调技术,地址
-
alphafold2 是一个用来进行非常精确的蛋白质结构预测的模型,2021 年 7 月 15 号发布在nature
-
transformer 变形体:
BERT(Bidirections Encoder Representations from Transformers)
transformer 模型的双向编码器表示,参考
- 有两种预训练策略
feature-base
特征基础,pre-training
预训练
fine-tuning
微调
- 双向的想法来自于
ELMo
- GPT,参数和数据量超大
-
开源项目
-
图形处理相关实现
以上参考 mli/paper-reading