收藏本版 |订阅

AI大模型 今日: 0|主题: 313|排名: 11 

  • cursor 1.2发布!Agent规划、更好上下文支持 & 更快的 Tab 补全!
    本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 🚀 魔都架构师 | 全网30W技术追随者 🔧 大厂分布式系统/数据中台实战专家 🏆 主导交易系统百万级流量调优 & 车联网平台架构 🧠 AIGC应用开发先行者 | 区块链落地实践者 🌍 以技术驱动创新,我们的征途是改变世界! 👉 实战干货:编程严选网 2025年7月3日 ...
    019 潇洒独行幸运星 发表于 2025-7-4 AI大模型
  • 开源人工智能:数字主权的基石
    随着人工智能正在重塑从教育到国防的方方面面,数字主权已不再是一个长期的愿景,而是一个迫在眉睫的现实需求。 为了确保各国能够对影响其社会的人工智能系统进行治理、审核和建设,开源人工智能正成为实现自主可控、激发本土创新、重建公众信任的关键支柱。 什么是数字主权? 数字主权是指一个国家或地区具备能力,依据自 ...
    055 一望平静 发表于 2025-7-1 AI大模型
  • 告别 CUDA!GPULlama3.java 横空出世,Java 首次实现原生 GPU 跑大模型
    本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 🚀 魔都架构师 | 全网30W技术追随者 🔧 大厂分布式系统/数据中台实战专家 🏆 主导交易系统百万级流量调优 & 车联网平台架构 🧠 AIGC应用开发先行者 | 区块链落地实践者 🌍 以技术驱动创新,我们的征途是改变世界! 👉 实战干货:编程严选网 0 前言 曼彻 ...
    086 有名堂 发表于 2025-6-30 AI大模型
  • Kafka运维利器:深入解析AdminClient原理与实战
    本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 🚀 魔都架构师 | 全网30W技术追随者 🔧 大厂分布式系统/数据中台实战专家 🏆 主导交易系统百万级流量调优 & 车联网平台架构 🧠 AIGC应用开发先行者 | 区块链落地实践者 🌍 以技术驱动创新,我们的征途是改变世界! 👉 实战干货:编程严选网 1 Kafka脚本 ...
    049 正能量的我 发表于 2025-6-29 AI大模型
  • 空有A100却在“吃灰”?给Javaer的三种CUDA“遥控器”,榨干GPU性能
    本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 🚀 魔都架构师 | 全网30W技术追随者 🔧 大厂分布式系统/数据中台实战专家 🏆 主导交易系统百万级流量调优 & 车联网平台架构 🧠 AIGC应用开发先行者 | 区块链落地实践者 🌍 以技术驱动创新,我们的征途是改变世界! 👉 实战干货:编程严选网 0 前言 有自 ...
    065 海岛大树 发表于 2025-6-28 AI大模型
  • 大模型的“Tomcat”:一文读懂AI推理引擎(Inference Engine)
    本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 🚀 魔都架构师 | 全网30W技术追随者 🔧 大厂分布式系统/数据中台实战专家 🏆 主导交易系统百万级流量调优 & 车联网平台架构 🧠 AIGC应用开发先行者 | 区块链落地实践者 🌍 以技术驱动创新,我们的征途是改变世界! 👉 实战干货:编程严选网 1 推理引擎是 ...
    04 东俊 发表于 2025-6-27 AI大模型
  • veRL代码阅读-2.Ray
    看VeRL代码之前发现代码里主要使用了ray框架来进行调度和通信. 所以先对ray进行初步学习, 后续有空闲时间再细看下Ray的代码. 框架原理 构成 架构图如下, ray里主要分为系统层面的layer和应用层的layer. 系统层layer: GCS(Global Control Store): 中心数据存储,是 Worker 之间传递消息的纽带, 储存了代码, 输入参数, 返 ...
    021 西瓜哥哥 发表于 2025-6-23 AI大模型
  • 大模型推理显存和计算量估计方法
    最近做吞吐量调试涉及到输入batch_size的设置,为了把算力和显存用起来,同时不触发out of memory,需要提前估计大模型推理过程中的显存占用,我参考了MindIE官网的这个文档完成了估计:https://www.hiascend.com/document/detail/zh/mindie/20RC2/mindieservice/servicedev/mindie_service0105.html 。 显存估计 大模型推 ...
    091 抓住你的心 发表于 2025-6-22 AI大模型
  • [开源自荐]iChat(AI Chat) 开源的智能聊天工具,支持MiMo、DeepSeek 、Gemini、Grok、OpenAI、ZenMux、OpenRouter、Cloudflare(AI Gateway) 和自定义AI
    [中文]|[English] iChat 是一款开源的智能聊天工具,支持 MiMo、DeepSeek 、Gemini、Grok、OpenAI、ZenMux、OpenRouter、Cloudflare(AI Gateway)和自定义AI,使用 SwiftUI 开发,macOS 原生 AI 客服端 开发环境 开发工具:Xcode 16.3 开发技术:SwiftUI SwiftData 系统支持:macOS 14+ 功能说明 现支持 MiMo、DeepSeek ...
    092 任云峰 发表于 2025-6-21 AI大模型
  • DeepSeek-R1源码解读
    最近和开发者做了很多DeepSeek-R1模型相关的推理项目,这两天抽时间把hugging face上面的源码拉下来仔细看了一遍,在这里做一个分享。主要是解析MOE部分的代码,包括EP并行的代码实现。 整体结构 查看hugging face上面的modeling_deepseek.py文件和config.json文件,可以发现代码结构和DeepSeek-V3是完全相同的。DeepseekV3 ...
    016 孩儿她爸 发表于 2025-6-20 AI大模型
  • 大模型VS小模型:论国产数据库运维AI Agent的正确打开方式
    作者:孙鹏,大衍(北京)科技有限公司研发工程师 首先为大家推荐这个 OceanBase 开源负责人老纪的公众号 “老纪的技术唠嗑局”,会持续更新和 #数据库、#AI、#技术架构 相关的各种技术内容。欢迎感兴趣的朋友们关注! 暴论:通用满血大模型“不适合”用于赋能国产数据库智能诊断运维 在传统数据库运维领域,长期面临三大 ...
    036 深尚线 发表于 2025-6-20 AI大模型
  • nanoVLM: 最简洁、最轻量的纯 PyTorch 视觉-语言模型训练代码库
    nanoVLM 是使用纯 PyTorch 训练 你自己的视觉语言模型 (VLM) 的 最简单 方式。它是一个轻量级 工具包 ,让你可以在 免费的 Colab Notebook 上启动 VLM 训练。 我们受到了 Andrej Karpathy 的 nanoGPT 的启发,为视觉领域提供了一个类似的项目。 从本质上讲,nanoVLM 是一个 工具包,可以帮助你构建和训练一个能够理解图像 ...
    065 黑哥哥 发表于 2025-6-18 AI大模型
  • 别再裸写 parseFrom() 了!这才是 MQTT + Protobuf 消费的正确姿势!
    本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 🚀 魔都架构师 | 全网30W技术追随者 🔧 大厂分布式系统/数据中台实战专家 🏆 主导交易系统百万级流量调优 & 车联网平台架构 🧠 AIGC应用开发先行者 | 区块链落地实践者 🌍 以技术驱动创新,我们的征途是改变世界! 👉 实战干货:编程严选网 0 前言 很多 ...
    021 腾腾视讯 发表于 2025-6-17 AI大模型
  • 解决 Maven os.detected.classifier 报错:快速修复指南
    本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 🚀 魔都架构师 | 全网30W技术追随者 🔧 大厂分布式系统/数据中台实战专家 🏆 主导交易系统百万级流量调优 & 车联网平台架构 🧠 AIGC应用开发先行者 | 区块链落地实践者 🌍 以技术驱动创新,我们的征途是改变世界! 👉 实战干货:编程严选网 0 前言 在 Ma ...
    016 鹅叨叨 发表于 2025-6-17 AI大模型
  • 解锁 ChatGPT 超能力:全新「记忆」功能深度解析!
    本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 🚀 魔都架构师 | 全网30W技术追随者 🔧 大厂分布式系统/数据中台实战专家 🏆 主导交易系统百万级流量调优 & 车联网平台架构 🧠 AIGC应用开发先行者 | 区块链落地实践者 🌍 以技术驱动创新,我们的征途是改变世界! 👉 实战干货:编程严选网 0 📌 注意事 ...
    063 雲鴻 发表于 2025-6-16 AI大模型
  • 如何分辨大模型的好坏?
    分辨大模型的好坏是一个多维度的问题,需要从技术能力、实际效果、安全性、成本和应用适配性等多个角度综合考量。以下是一些关键的评估维度和方法: 一、核心能力维度 1、基础能力: 语言理解与生成: 流畅度、语法准确性、上下文连贯性、能否理解复杂指令和隐含信息? 知识覆盖与准确性: 知识广度(涵盖多少领域?)、知 ...
    019 秋枫糖糖 发表于 2025-6-16 AI大模型
  • 谷歌官宣的A2A协议为啥能让智能体学会“团队合作”?
    本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 🚀 魔都架构师 | 全网30W技术追随者 🔧 大厂分布式系统/数据中台实战专家 🏆 主导交易系统百万级流量调优 & 车联网平台架构 🧠 AIGC应用开发先行者 | 区块链落地实践者 🌍 以技术驱动创新,我们的征途是改变世界! 👉 实战干货:编程严选网 1 智能体互 ...
    043 大朗喝药啦 发表于 2025-6-12 AI大模型
  • AI 聊天应用的 10 条高级需求
    最新动态 GitHub 开源: https://github.com/experdot/pointer [MIT] 前言 过去一段时间,我较为深入地使用了多款 Web 端和桌面端的大语言模型聊天工具。在日常使用中,我逐渐意识到,这些工具在基础的问答能力上已经做得不错,但在围绕对话本身的管理、组织和流转方面,仍然存在明显的不足。 这些不足在偶尔使用时并不显 ...
    033 我们终究还是陌生了 发表于 2025-6-12 AI大模型
  • 华为Ascend 910B部署Qwen2.5-VL-32B方案
    华为Ascend 910B部署Qwen2.5-VL-32B方案 目录一、多模态大模型——Qwen2.5-VL-32B1.1 简介1.2 显存测算1.2.1 Model Memory Calculator工具测算1.2.2 按模型参数量一般测算1.3 算力测算1.3.1 单 Token 理论计算量估算二、华为昇腾910B(64GB)2.1 简介2.2 Atlas 800I A2 推理服务器三、Qwen2.5-VL-32B-Instruct部署到华为昇 ...
    0100 拍照媚姐 发表于 2025-6-11 AI大模型
  • Invalid context structure解决Dify框架中图像推理错误:一步步排查与修复指南
    本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 🚀 魔都架构师 | 全网30W技术追随者 🔧 大厂分布式系统/数据中台实战专家 🏆 主导交易系统百万级流量调优 & 车联网平台架构 🧠 AIGC应用开发先行者 | 区块链落地实践者 🌍 以技术驱动创新,我们的征途是改变世界! 👉 实战干货:编程严选网 0 工作流信息 ...
    094 俊阳电脑科技 发表于 2025-6-9 AI大模型
  • 下一页 »

    快速发帖

    还可输入 180 个字符
    您需要登录后才可以发帖 登录 | 立即注册

    本版积分规则

    相关侵权、举报、投诉及建议等,请发 E-mail:qiongdian@foxmail.com

    Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.

    在本版发帖返回顶部