AI 常见的模型介绍

发布时间: 更新时间: 总字数:697 阅读时间:2m 作者: IP上海 分享 网址

AI 常见的模型介绍

介绍

  • WebDev Arena Leaderboard:开源基准测试,评估 Web 开发中的 AI 能力
  • 推荐使用的模型(2025/01/11)
    • openai/gpt-4o
    • gemini-2.0-flash-exp(速度最快的模型)
    • gemini-exp-1200(Google 最强大的模型)
    • qwen-vl-max / qwen-vl-plus
    • anthropic/claude-3.5-sonnet(编程好)
    • deepseek-chat / deepseek-coder(编程好)
    • qwen2.5-72B
    • qwen2.5-coder-32b-instruct
  • 数学能力
  • 文字生成图形
    • flux
    • gork
    • PaliGemma2
  • LLAMA
    • 开发者 meta
    • 模型包括:Llama 3.1, Llama 3.2, Llama 3.3

AI API 供应商

模型格式

GGUF 格式

  • GGUF(GPT-Generated Unified Format) 是由 Georgi Gerganov 定义发布的一种大模型文件格式
    • Georgi Gerganov 是著名开源项目 llama.cpp 的创始人,他提出 GGUF 格式是为了解决大模型文件在不同平台和工具之间转换的问题
    • GGUF 是一种二进制格式文件的规范,原始的大模型预训练结果经过转换后变成 GGUF 格式可以更快地被载入使用,也会消耗更低的资源
    • GGUF 是 GGML 的替代者
    • GGUF 文件组成如下
      • 文件头 (Header)
      • 元数据键值对 (Metadata Key-Value Pairs)
      • 张量计数 (Tensor Count)
      • 张量信息 (Tensor Info)
      • 对齐填充 (Alignment Padding)
      • 张量数据 (Tensor Data)
      • 端序标识 (Endianness)
      • 扩展信息 (Extension Information)

ONNX 格式

  • ONNX(Open Neural Network Exchange) 是微软和 Facebook 提出用来表示 深度学习模型 的开放格式
    • 开放ONNX 定义了一组和环境,平台均无关的标准格式,来增强各种 AI模型 的可交互性
    • 无论使用何种训练框架训练模型(如 TensorFlow/Pytorch/OneFlow/Paddle),在训练完毕后都可以将这些框架的模型统一转换为 ONNX 格式进行存储
      • ONNX 使用 Protobuf 序列化数据结构,来存储神经网络的权重信息
      • onnx.proto 定义了 ONNX 数据协议的规则和一些其它信息,核心概念
        • ModelProto
        • GraphProto
        • NodeProto
        • ValueInfoProto
        • TensorProto
        • AttributeProto
    • 示例参考
Home Archives Categories Tags Statistics
本文总阅读量 次 本站总访问量 次 本站总访客数