AI大模型应用开发入门-LangChain实现文档总结
一、整体思路
长网页文本往往超过 LLM 单次处理的 token 限制,我们需要设计一个 map-reduce 流水线来拆分、局部总结、归并:
加载网页内容
拆分成可控大小的 chunk
对每个 chunk 做初步总结 (map)
汇总所有初步总结 (reduce)
如有需要递归 reduce 直到满足 token 限制
输出最终总结
接下来我们用 ...
pytorch入门 - 基于AlexNet神经网络实现猫狗大战
基于之前的博客 pytorch入门 - AlexNet神经网络,并借助Kaggle 的 Dogs vs Cats Redux 数据集,实现一个基于 AlexNet 的二分类模型识别猫与狗。
完整流程涵盖数据准备、归一化、模型定义、训练增强、验证并可视化结果。
一、数据集准备与预处理
import os
import shutil
def split_data(ROOT_ ...
爬取爱奇艺电影榜单信息
实验介绍:
代码爬取了爱奇艺的多个榜单图片和榜单信息。
由于爱奇艺的数据格式,电影榜top100是获取json文件爬取的,电影榜单top25是通过HTML文件爬取的。
代码有数据结构的设计,模块划分。
代码如下:
import os
import json
import requests
from bs4 import BeautifulSoup
from urllib.robotparser import RobotFilePa ...
基于Socket实现信息交互和文件上传及下载
实验介绍:
用python代码实现,服务器有三个功能:信息交互、文件上传、文件下载。
客户端输入1,进入信息交互功能。客户端输入2,进入文件上传。客户端输入3,文件下载。
输入q结束服务。
文件的上传和下载路径可以由客户端手动输入。
需要先运行服务器端再运行客户端。
代码如下
client端代码:
import socket #实现网络 ...
Python 潮流周刊#107:无 GIL Python 被正式批准(摘要)
本周刊由 Python猫 出品,精心筛选国内外的 400+ 信息源,为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景:帮助所有读者精进 Python 技术,并增长职业和副业的收入。
温馨提示: 在微信关注 Python猫,发送“优惠券”,即可领取 9 折优惠码,订阅专栏可享 15 元优惠。
分享了 12 ...
taskiq异步分布式任务管理器 适用fastapi
taskiq 异步分布式任务管理器
https://taskiq-python.github.io/
将 taskiq 视为 asyncio celery 实现。它使用几乎相同的模式,但它更加现代和灵活。
它不是任何其他任务管理器的直接替代品。它具有不同的库生态系统和一组不同的功能。此外,它不适用于同步项目。将无法同步发送任务。
1 安装taskiq
pip install taskiq
2 ...
AI大模型应用开发-用LangChain构建PAL应用:SQL的生成与执行
PAL(Program-Aided Language models) 思想成为大模型 Agent 领域的重要范式。核心思路是 LLM 只负责语言任务,复杂的逻辑/计算交由程序执行。
通过合理设计 prompt,模型生成代码/SQL/逻辑描述,外部程序再执行,得到结果后反馈给 LLM,LLM 再生成最终答案。
本文将通过一个 LangChain + MySQL + Postgres ...
Python高性能编程第3版3列表和元组
3 列表和元组
主要内容:
列表和元组有什么用?
在列表/元组中查找的复杂性是什么?
如何实现这种复杂性?
列表和元组有哪些区别?
如何对列表进行追加?
什么时候应该使用列表和元组?
编写高效程序最重要的一点是了解所使用数据结构的保证。事实上,高效编程的很大一部分就是要知道你想对数据提出什么问题,并选择一种 ...
Python高性能编程第3版1了解高性能Python-4如何成为高性能程序员5:Python 的未来
1.4 如何成为高性能程序员
编写高性能代码只是长期成功项目中高性能的一部分。团队远比速度提升和复杂的解决方案更重要。这其中有几个关键因素--良好的结构、文档、可调试性和共享标准。
假设你创建了一个原型。你没有对它进行彻底测试,也没有让团队对它进行审核。它看起来确实 “足够好”,并被推向生产。由于它从未以结 ...
AI大模型应用开发-用LangChain构建带Agen流程的RAG系统
随着大模型(LLM)能力越来越强,RAG(Retrieval Augmented Generation,检索增强生成)技术成为增强大模型知识准确性的关键手段。
通过检索实时数据、外部文档,模型能回答更多基于事实的问题,降低“幻觉”概率。
而 LangChain 的 LangGraph 能将 LLM、RAG、工具调用(Tools)整合成一个智能 Agent 流程图,极大提升了问 ...
python开发之路【第一章】:计算机基础结构
1.1计算机基础
1.1.1 硬件
1944年,美籍匈牙利数学家冯·诺依曼提出计算机基本结构。
五大组成部分:运算器、控制器、存储器、输入设备、输出设备。
-- 运算器:按照程序中的指令,对数据进行加工处理。
-- 控制器:根据程序需求,指挥计算机的各个部件协调工作。
通常将运算器和控制器集成在中央处理器(CPU)中。
-- 存 ...
掌握ChangeSpeed类:让数学动画速度随心而动!
在制作数学动画时,我们常常希望动画的速度能够根据需要进行调整,以更好地展示数学概念的演变过程。
Manim框架中的ChangeSpeed类就是这样一个强大的工具,它能够帮助我们轻松地控制动画的速度变化,让动画更加生动和富有表现力。
1. 主要作用
ChangeSpeed类的主要作用是改变动画的播放速度。
在数学动画中,有些部分可能需 ...
AI大模型应用开发入门-LangChain开发RAG增强检索生成
检索增强生成(RAG)是一种结合“向量检索”与“大语言模型”的技术路线,能在问答、摘要、文档分析等场景中大幅提升准确性与上下文利用率。
本文将基于 LangChain 构建一个完整的 RAG 流程,结合 GVector 作为向量数据库,并用 LangGraph 构建状态图控制流程。
大语言模型初始化(llm_env.py ...
Python 潮流周刊#106:PEP-734 正式接纳,多解释器时代来临(摘要)
本周刊由 Python猫 出品,精心筛选国内外的 400+ 信息源,为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景:帮助所有读者精进 Python 技术,并增长职业和副业的收入。
温馨提示: 在微信关注 Python猫,发送“优惠券”,即可领取 9 折优惠码,订阅专栏可享 15 元优惠。
本期共分享 ...
pytorch入门 - VGG16神经网络
1.VGG16背景介绍
VGG16是由牛津大学Visual Geometry Group(VGG)在2014年提出的深度卷积神经网络模型,它在当年的ImageNet图像分类竞赛中取得了优异成绩。
VGG16的主要贡献在于展示了网络深度(层数)对模型性能的重要性,通过使用多个小尺寸(3×3)卷积核堆叠来代替大尺寸卷积核,在保持相同感受野的同时减少了参数数 ...
AI大模型应用开发入门-LangChain开发Agent
基于 LangChain 和 GPT-4o-mini 的大模型智能体开发实战
近年来,大模型能力的持续突破,使得构建智能代理(Agent)系统成为开发者追逐的热点。
本文将以 LangChain 框架为核心,结合 GPT-4o-mini 模型,通过接入工具与消息修剪策略,实现一个具备记忆、调用搜索、执行函数能力的智能体。
环境准备与模型初始化
使用 LangCh ...
AI大模型应用开发入门-LangChain开发聊天机器人ChatBot
在大模型应用开发中,状态管理 和 对话追踪 是不可忽视的重要能力,尤其在需要保存上下文、重放对话或进行异步处理时尤为关键。
今天我们来演示如何用 LangChain + OpenAI 的 GPT 模型 + PostgreSQL 搭建一个 具备消息存储能力 的聊天机器人。
技术栈
LangChain(LangGraph 模块)
OpenAI GPT-4o-mini(或任意兼容模型 ...
python爬虫获取B站视频评论
代码使用deepseek生成
免责声明:本文章涉及到的应用仅供学习交流使用,不得用于任何商业用途,数据来源于互联网公开内容,没有获取任何私有和有权限的信息(个人信息等)。由此引发的任何法律纠纷与本人无关!
点击查看代码
import requests
import time
import re
import csv
from datetime import datetime
import os
...
[python]requests VS httpx VS aiohttp
前言
前段时间想着把一个python服务的接口逐渐改成异步的,其中用到requests的地方就要改成httpx或者aiohttp,有点好奇异步请求相较于同步请求有哪些提升,遂做了点小实验。
首先有个服务A提供接口,这个接口会停顿1秒,模拟数据库操作。服务B去请求服务A的这个接口,并把响应返回给客户端C。服务B提供4个接口,这4个接口分 ...
pytorch入门 - AlexNet神经网络
AlexNet背景
AlexNet是2012年由Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton提出的深度卷积神经网络架构。
它在ImageNet大规模视觉识别挑战赛(ILSVRC)中取得了突破性成绩,将top-5错误率从26%降低到了15.3%,这一成就标志着深度学习在计算机视觉领域的崛起。
AlexNet的成功主要归功于以下几个创新点:
使用ReLU(Rect ...