iNeuOS工业互联网操作系统集成大模型智库(iNeuOS_AiMind·心智灵慧)
New
1. 概述
iNeuOS工业互联网操作系统作为工业数字化底座,长期面向设备采集、数据处理、数据分析、报警监控、远程控制和业务应用集成等场景提供统一的平台能力。在工业现场,数据分散、经验分散、知识分散往往是企业推进智能化升级时遇到的第一道门槛。
随着模型智库模块“iNeuOS_AiMind·心智 ...
大模型基础(四):强化学习入门-从斯金纳箱到大模型推理
New
2025年图灵奖颁给了强化学习的奠基人Richard Sutton和Andrew Barto。为什么强化学习如此重要?它如何从训练老鼠变成训练大模型?这篇文章带你一探究竟。
一、一个老鼠实验引发的革命
1.1 斯金纳箱:强化学习的源头
1930年代,心理学家斯金纳做了一个著名实验:
实验过程:
把一只老鼠放进箱子
箱子里有一个杠杆
老鼠偶 ...
Hy-MT1.5-1.8B-2bit:腾讯开源 574MB 能打败 72B 巨人的移动端翻译模型
New
Hy-MT1.5-1.8B-2bit:Tencent 开源 574MB 能打败 72B 巨人的移动端翻译模型
TL;DR
Hy-MT1.5-1.8B-2bit 是腾讯混元团队推出的突破性 2-bit 量化翻译模型,将 3.3GB FP16 模型压缩至仅 574MB,同时保持世界级翻译质量
基于腾讯自研的 SEQ(Stretched Elastic Quantization,弹性延伸量化) 技术,属 AngelSlim 压缩工具包的 ...
彻底解决大模型 JSON 报错:提示词 + 硬约束 + 兜底的全链路修复方案
New
众所周知,大模型的核心原理是『文字接龙』,通过概率计算输出下一个 Token,这种机制天然存在幻觉问题,导致模型会一本正经的胡说八道。
当要求大模型输出 JSON 格式时,也常因为幻觉问题遇到各种格式灾难:
附带冗余话术:比如前后夹带“好的,这是你要的结果”、“以下是符合要求的JSON”。
Markdown 标签包裹:带有 ...
Windows平台下CUDA安装及llama.cpp使用教程
New
本文将详细讲解Windows平台下,如何安装与NVIDIA RTX显卡匹配的CUDA工具包,并正确配置、使用llama.cpp加载大模型,实现模型高效运行(将模型几乎全放入显卡,提升推理速度),全程结合实操截图与具体命令,新手可直接跟着操作。
1.首先需要下载与RTX对应的CUDA驱动,此处必须保证完全一致,执行nvidia-smi命令获取版本信息 ...
LangChain框架-基础
1.LangChain是什么?
LangChain 是⼀个⽤于开发---> 由(⼤型语⾔模型(LLMs)驱动的应⽤程序)的框架。
简单来说理解就是一个用开发开发大模型应用的开发框架,内部集成了很多功能,也有很多第三方生态扩展,用起来事半功倍,就把他想象成C#中的.NET Core框架,go中的Gin。
它简化了大语言模型应用程序生命周期的各个阶 ...
方差在扩散模型保护中的作用
Variance in Adversarial Attack for Customized Diffusion Models
IDProtector:一种对抗性噪声编码器,用于防范保留身份的图像生成
Related Works
Tuning-based Customized Generation
DreamBooth, Custom Diffusion, LoRA and Textual Inversion
需要多图像微调,它们需要大量的计算资源和时间
Encoder-based ID-Preserv ...
Qwen3.6-35B-A3B 全面评测:阿里开源模型如何超越前沿级水平
Qwen3.6-35B-A3B 全面评测:阿里开源模型如何超越前沿级水平
TL;DR
Qwen3.6-35B-A3B 是阿里 Qwen 团队2026年4月16日发布的最新开源模型,采用稀疏 MoE 架构,35B 总参数但每 token 仅激活 3B
Apache 2.0 许可证,完全开源可商用
在 Terminal-Bench 2.0 得分 51.5(vs Gemma4-31B 的 42.9),SWE-bench Verified 得分 73.4 ...
做 AI 应用必懂:Function Call 和 Skills,到底差在哪?
前言
今天来详细讨论一下,function call 和 skills。function call 到底是什么,skills 到底是什么,它们分别解决什么问题,最本质的区别在哪,以及在 Agent 系统里该怎么配合
function call
function call 的本质,是让模型以工程化的方式调用某个具体工具或函数
以前模型想调用外部能力,通常只能口头表达——比如它输 ...
先免费试用下Claude code安装使用(教程)
🧑💻 写在开头
点赞 + 收藏 === 学会🤣🤣🤣
2026年了,如果还不会使用一款AI编程工具,未来将会越来越难行。 今天我们先来使用一个终端编程比较火的工具:Claude code
一、安装
1、nodejs安装
如果你本地没有node环境,是需要先安装node的,node版本至少要18.0以上,可点击下面地址跳转到nodejs官网下载下载Node.js ...
LlamaIndex高级RAG实战:从检索增强到知识图谱问答
一、RAG的局限与高级RAG
基础RAG(检索增强生成)存在明显短板:检索精度低、缺乏多跳推理、无法处理复杂查询。高级RAG通过查询改写、重排序、知识图谱增强等技术,将RAG从简单检索提升到深度问答。LlamaIndex是构建高级RAG系统的首选框架,提供丰富的索引结构和检索策略。
二、LlamaIndex核心架构
核心组件:
- Document/N ...
AI应用-提示词工程
1.什么是提示词和提示词工程?
提示词和提示词工程
提示词如何理解就是我们对大模型说的每一句话都是Prompt,例如咱们使用DeepSeek或者某包上面问一些问题,或者给出一些指令,而大模型跟你来回交互,其实就是在续写你给他的提示词(Prompt),当然也可以理解为用来引导模型输出特定的回答,或者做一些任务的一组词语。
提示 ...
DeepSeek-V3 + Spring Boot实战:10分钟接入国产大模型API
一、DeepSeek-V3 简介
DeepSeek-V3是深度求索推出的最新大语言模型,在代码生成和中文理解上表现优异。其API兼容OpenAI格式,开发者可零成本迁移。本文将手把手演示Spring Boot接入DeepSeek-V3 API。
二、获取API Key
1. 访问 platform.deepseek.com 注册账号
2. 进入API Keys页面,点击创建API Key
3. 复制Key(格式:sk-x ...
别再混着用了:agent 和 workflow 到底有什么区别?
前言
一个agent,一个workflow。很多朋友在群里一聊就是“我搞了个 agent”,结果仔细一看,其实只是配了个固定流程;也有老哥把本该交给 workflow 的事,硬塞给 agent,最后调了半天,成本起飞,效果还不稳定
所以这篇文章,笔者就把 agent 和 workflow 的区别掰开揉碎了讲清楚
基本概念
workflow 是什么
说白了,它像流水 ...
LLM微调实战:用LoRA让大模型更懂你的业务
一、为什么需要微调?
预训练大模型(如GPT、Llama、Qwen)具备强大的通用能力,但在垂直领域往往表现不佳。微调(Fine-tuning)通过在特定领域数据上继续训练,让模型"学会"你的业务知识、术语和风格。
二、LoRA为什么是最佳选择?
LoRA(Low-Rank Adaptation)的核心思想是:冻结预训练模型的原始权重,只训练两个低秩矩 ...
Context 工程:如何把正确的上下文喂给 AI
我们在项目中一定都遇到过,AI 明明很"聪明",工具也都接好了,结果你让它改个 bug,它改的完全不是你想要的文件;你让它写个组件,它生成了一套跟项目风格完全不搭的代码。
这不是 AI 笨,也不是工具不行,「而是你"喂"给它的上下文不对。」
你可以把 AI 想象成一个远程结对编程的同事——他水平很高,但「他只能看到你屏 ...
深度解析Claude Code 51万行源码背后的设计实现
最近发生了一件非常大的事情,全球最强的AI编程工具Claude Code,因为Anthropic的一个低级失误——打包npm包的时候忘了删source map文件——51万行源代码,全部暴露在互联网上。
几个小时之内,代码就被全世界的开发者下载、镜像、拆解。Anthropic紧急下架了包,但互联网没有删除键。因为 Claude Code 意外泄露了 sour ...
OpenClaw AI助手本地部署完整教程
换了套本地AI工具,叫OpenClaw。用了一段时间,稳定性不错,扩展性也比我预期的好用。顺手整理了份部署教程,给想尝鲜的朋友参考。
一、什么是OpenClaw
OpenClaw是一个本地的AI助手框架,核心能力是多Agent协作。
你可以把它理解成:一个Gateway(网关) + 多个专业Agent(专家)。每个Agent专注一个领域——写作、编程、表 ...
分布式智能体|A2A Agent实战
随着智能体应用的广泛应用,智能体的分布式部署、跨网络、跨框架、跨组织调用,成为当下智能体落地急需解决的问题。针对这一痛点,Google推出了Agent2Agent(简称A2A)协议,专为智能体之间的互联互通、协同协作提供标准化的解决方案。
本文基于Spring AI Alibaba框架,使用Nacos作为注册中心,落地完整的分布式智能体方案 ...
向量数据库实战:Milvus入门与Java集成
前言
向量数据库是 RAG 系统的核心组件,负责存储和检索高维向量数据。Milvus 是最流行的开源向量数据库,支持十亿级向量检索。本文带你快速入门 Milvus,并完成 Java 集成。
一、Milvus 核心概念
Collection:向量数据的集合,类似数据库中的表
Partition:集合的分区,提升查询性能
Vector Field:存储向量数据的字段
In ...