AI大模型今日: 0|主題: 314|排名: 1

前言 DeepSeek作为国产顶级大模型，已经成为开发者日常工作中不可或缺的工具。但很多人只是简单地输入问题，并没有充分发挥它的实力。本文总结10个实用技巧，让你的DeepSeek使用效率翻倍。技巧1：明确角色设定在提问前先告诉DeepSeek它是谁：你是一个资深10年的Java高级开发工程师，熟悉Spring Boot、分布式架构和性能优 ...

0119

劝你当个人别当狗发表于 2026-3-23 AI大模型

"Memory in the Age of AI Agents: A Survey" 论文笔记

背景智能体记忆如今极其碎片化，研究人员们发现，当大家谈论智能体记忆时，所指的可能完全是不同的事物：有人专注于存储用户对话历史，有人研究如何从失败中提炼策略，还有人试图将知识直接烙进模型参数里。同时，大量新兴术语（如陈述性记忆、情景记忆、参数记忆等）的涌现，进一步模糊了概念的清晰度因此，这篇综述直指 ...

0100

易孟喜发表于 2026-3-22 AI大模型

玩一玩微软的 1 bit 模型：BitNet. 一个 CPU 就能跑起来的大模型

作者:张富春(ahfuzhang)，转载时请注明作者和引用链接，谢谢！ cnblogs博客 zhihu Github 公众号:一本正经的瞎扯能不能用 1 个 CPU 加很少的内存就能把大模型跑起来？微软开源的 BitNet (https://github.com/microsoft/BitNet) 实现了这一点。可以通过这个网址去在线体验这个模型的效果：https://demo-bitnet-h0h8hc ...

0146

一杯普洱发表于 2026-3-20 AI大模型

Docker+本地部署openclaw+接入IM+创建Agent

Docker+deepseek云模型本地部署openclaw 一、配置openclaw+QQBot docker 请确保电脑上已配置好 Docker 和 Docker Compose。下载链接： Docker: Accelerated Container Application Development 或 Docker中文网根据系统选择适用版本，安装步骤可查。 # 检查 Docker 版本 docker --version # 检查 Docker Compose 版本 d ...

054

杨夏陵发表于 2026-3-19 AI大模型

ICLR2026 | Ada-RefSR: 自适应隐式相关建模，开启“信而有证”的参考超分新范式

作者： vivo BlueImage Lab摘要：我们针对于单步SD的超分模型容易出现幻觉问题，提出了信而有证参考超分新范式，基于单步扩散模型构建，首先通过注意力机制引入参考信息，随后通过隐式相关性建模进行过滤与验证，对应的论文已被 ICLR2026 接收！该工作由vivo BlueImage Lab，南开大学共同完成。项目主页： https://github. ...

0157

娱乐透视发表于 2026-3-19 AI大模型

AIAgent开发-LangChain

前言回顾人类与机器的协同模式已经经历了如下几大阶段：搜索引擎阶段：机器负责信息检索，人进行逻辑推理、任务执行。 LLM阶段：机器负责内容推理和任务执行，人输入指令。 Agent阶段：机器负责推理决策 + 自主执行，人输入目标定义、需求明确、结果校验。如运维领域已经出现了SQL/代码审计、AIOPS故障定位根因分析、OA ...

067

鱼儿在飞发表于 2026-3-19 AI大模型

从一个地狱笑话看大模型的推理机制

作者:张富春(ahfuzhang)，转载时请注明作者和引用链接，谢谢！ cnblogs博客 zhihu Github 公众号:一本正经的瞎扯从一个地狱笑话看大模型的推理机制我大约在七年前就看见了这个段子：三个苹果平均分给五个小朋友，只能切两刀，应该怎么切？评论区置顶的内容是这么写的：一刀捅死一个小朋友，然后剩下的三个小朋 ...

054

克矛发表于 2026-3-18 AI大模型

Spring with AI (3): 定制对话——Prompt模板引入

本文代码：https://github.com/JunTeamCom/ai-demo/tree/release-3.0 Spring with AI系列，只关注上层AI的应用程序（基于JAVA搭建），不关注底层的LLM原理、搭建等技术。通过简单的自定义Prompt模板，即可定制一个AI，专注某一领域的知识回答。 1 创建模板先在pom.xml引入验证Starter： <dependency> <groupId>org.spr ...

094

水煮鸡蛋发表于 2026-3-17 AI大模型

CLIP：连接视觉与语言的桥梁

什么是 CLIP？ CLIP（Contrastive Language-Image Pre-training，对比语言-图像预训练）是 OpenAI 提出的一种多模态预训练模型。它采用对比学习和双塔架构，实现了视觉与语言的统一表征。 CLIP并不像是一种模型，更像是一种方法，一种通用的将计算机视觉模型与自然语言处理领域模型结合的方法为什么需要 CLIP？传统的图 ...

050

执笔写余生发表于 2026-3-15 AI大模型

深入理解 Transformer：从数据流动看模型架构

论文链接：Attention Is All You Need 这篇论文提出了 Transformer 模型架构，这是一个序列到序列的模型，在论文中被应用于英德和英法两个机器翻译任务。由于 Transformer 被用于翻译任务，整个模型的输入维度是 (batch_size, seq_len)，输出维度是 (batch_size, seq_out_len)。模型采用 Encoder-Decoder 架构，下面是模 ...

048

燉燉妈妈发表于 2026-3-14 AI大模型

强化学习基础（RL）笔记

RL 简介 (1) 定义强化学习（Reinforcement Learning）是一种机器学习方法，用于解决需要在一定环境下通过与环境交互来学习最有行为策略的问题。其核心思想是通过试错和奖励机制来指导智能体（Agent）学习如何在不同情境下采取行动，以最大化长期累积奖励 (2) 强化学习流程强化学习中的 agent 用来表示做决策的机器，相比 ...

0142

不用掩饰发表于 2026-3-13 AI大模型

AI时代，人人都是系统设计工程师

AI时代，人人都是系统设计工程师 AI时代，你可以让AI替你打工。最近OpenClaw很火，它可以承担产品、UI、程序员、测试等一系列职责，这些工作你都可以交给它来完成。但AI还是需要人来给它意图和指令，否则AI也不知何去何从。随着AI能力的提升，软件开发中的岗位边界正在变得模糊。传统意义上的产品、UI、前端、后端、大数据 ...

0123

黄河大李鱼发表于 2026-3-11 AI大模型

Stanford-CS336-Lecture-02 Pytorch

本内容为Stanford CS336 Lecture 02，主要不是为pytorch的所有方法进行详细的讲解，而是提供对pytorch的一些必要的、角度不一样的理解。视频链接如下：【中英字幕完结】斯坦福CS336：从头开始构建大模型 _ 2025年最新 - 2.第2集：pytorch手把手搭建LLM_哔哩哔哩_bilibili 1.tensor的数据类型 tensor又称张量，可以认为是计 ...

082

飘渺李煜发表于 2026-3-10 AI大模型

Gemini 3.1 Flash-Lite 正式上线：专为规模化智能而生

内容来源于谷歌官方，由谷歌云谷歌地图合作伙伴 CloudAce 深圳云一进行翻译发布。导语： Google 扩展了 Gemini 3 模型家族，正式推出 Gemini 3.1 Flash-Lite。作为该系列中速度最快、性价比最高的模型，它专为应对大规模高容量的开发工作负载而设计，在模型等级与价格平衡方面树立了新的行业标杆。目前，开发者已可通过 ...

0132

舒凡人生发表于 2026-3-10 AI大模型

‍装了 OpenClaw 后，信用卡被盗刷了...

前两天有个哥们发现自己信用卡被盗刷了。他慌了，让自己部署的 OpenClaw 帮忙排查一下到底怎么回事。龙虾查了一圈，回复他：你没看错。这是 AI 回复的。这哥们给自己的 OpenClaw 取名叫"顾衍"，一只有名有姓的 AI 龙虾，查完安全日志之后，第一反应是骂了一句街。用户让它继续查到底是哪里出了问题。龙虾先排查了 SS ...

0132

胖鸵鸟发表于 2026-3-9 AI大模型

监督微调（SFT）笔记

SFT 简介 (1) 什么是监督微调监督微调（SFT）通过利用特定于任务的标签数据集将预训练的 LLM 适应特定任务。SFT 的数据集通常组织如下，一条样本包含一个指令和对应的回答：\(D=\{(I_K,A_K)\}_{K=1}^N\) (2) 监督微调和预训练的区别在训练方式上没有任何区别，损失函数一样，主要区别在于数据的组成形式上：预训练的每 ...

0149

我的人生不能将就发表于 2026-3-9 AI大模型

OpenClaw中级到高级教程

OpenClaw从"能用"迈向"好用"的关键跨越。下面这份教程将涵盖你关注的记忆系统、网络搜索、服务器部署、接入微信/飞书、安装skills、多Agents功能，并补充心跳机制的说明，帮你系统性地掌握这些进阶能力。一、记忆系统优化：从记录到智能检索基础记忆依赖Markdown文件，存在"失忆"和检索困难的问题。进阶记忆系统通过分层 ...

091

一个劲儿的巴巴发表于 2026-3-8 AI大模型

女生必看！用OpenClaw'龙虾'当你的24小时免费助理，职场、生活效率翻倍，做自己的女王！

🌟 前言在职场和家庭中，女性常常身兼数职——职场精英、家庭主妇、孩子的妈妈...时间总是不够用。今天我要介绍一个超级好用的AI助理——OpenClaw（龙虾），24小时为你待命，帮你搞定每一件琐事！ 🦞 什么是OpenClaw？ OpenClaw是一个开源AI Agent平台，别名"龙虾"。它就像一个全能的私人助理，能够： ✅ 24小时在线服务 ...

052

量体截衣发表于 2026-3-7 AI大模型

🔥阿里开源神器！一行代码让网站秒变 AI 原生应用，Page-Agent 太强了！

前言最近发现了一个超厉害的开源项目——Page-Agent，这是阿里巴巴开源的浏览器内 GUI Agent 框架，只需要一行代码就能让你的网站秒变 AI 原生应用！今天就来给大家详细扒一扒这个神器。什么是 Page-Agent？ Page-Agent 是一个纯前端的浏览器内 GUI Agent 框架，它的核心理念是：让任何网站都能轻松集成 AI 能力，无需后 ...

097

年轮虎发表于 2026-3-7 AI大模型

AI 工程化实战：拒绝“开盲盒”，像写代码一样搞定提示词工程！

本文全面介绍了提示词相关内容，包括提示词工程的重要性，如何写好一个提示词，以及使用 Coze 平台进行实操，适合零基础小白入门。面对汹涌而来的 AI 浪潮，很多研发同学感到焦虑。但其实，对于非算法背景的我们来说，不需要成为研发「发动机」的算法科学家，而是要成为能够驾驭「赛车」的 AI 工程师。今天，我们就来学 ...

081

看繁花落尽发表于 2026-3-6 AI大模型

1 234 5 6 7 8 9 10 ... 16 / 16 頁下一頁

返回發新帖

AI大模型今日: 0|主題: 314|排名: 1

快速發帖

瀏覽過的版塊

AI大模型 今日: 0|主題: 314|排名: 1

快速發帖

瀏覽過的版塊

AI大模型今日: 0|主題: 314|排名: 1