张子阳的博客 - 技术.读书

最新内容

文章: 311

阅读: 1308703

今日阅读: 285

今日访客: 173

Amazon 在 2025.7.14 发布了kiro预览版。与Cursor、Trae（AI编程IDE）或者Claude Code、Gemini CLI（AI控制台编程工具）有所不同，这款新的AI编程工具最大的特色是集成了所谓的“规范驱动编程”（Spec-Driven Programming）。即：开发前先编写好需求、设计、任务文档，再基于文档进行代码生成。与之对应的，则是“氛围编程”（Vibe Coding）。这篇文章将简要描述一下两者的不同，以及在Claude Code中实现规范驱动编程的步骤。

阅读: 1104 发表: 2025-08-12

Claude Code提示词模板

近期体验了Gemini CLI 和 Claude Code两款AI编程工具，其使用方式大体上是“文档先行”的：先写好需求文档，然后通过@符，引用文档。接着在控制台提出请求：根据文档，执行操作。AI编程工具（后面简称Claude）就会根据需求文档，完成相应的编码或者其他操作。使用这种方式工作时，需要知道 Claude毕竟不是你肚子里的蛔虫，当你的文档描述的不够清晰、具体，那么它的实现结果就可能是走样的。这篇文章我就列一些常用任务的需求模版，以后根据实际使用过程中遇到的问题，再进行调整。

阅读: 1065 发表: 2025-07-22

Windows11下安装WSL2和CentOS

WSL2（Windows Subsystem for Linux 2）是微软开发的第二代Linux子系统，允许在Windows系统中无缝运行原生Linux环境，无需虚拟机或双系统。其最大的好处之一是文件系统是共享的，例如：可以在Linux环境下通过 /mnt/c 来访问C盘。这样我们可以在WSL2中运行一个centos，然后在其上运行gemini CLI或者Claude Code，进行自行编码，而我们的开发环境依然是Windows。这样可以减少很多gemini cli在Powershell环境下，脚本命令报错比较多的情况。这篇文章将介绍如何在 Windows11 上安装WSL2，以及如何在 WSL2 中安装 centos。

阅读: 968 发表: 2025-07-12

LlamaIndex 自然语言SQL查询 Text2Sql

在大语言的众多应用场景中，对自然语言进行SQL转换，然后返回SQL查询结果（Text2Sql），是其中最常见的一种。官方文档已经提供了两篇文教程，一篇简单的，一篇复杂的，来实现这一过程。其中简单的一篇，地址是这个：Text-to-SQL Guide (Query Engine + Retriever)。本文将基于这篇教程，来实现这一过程。

阅读: 778 发表: 2025-07-01

Gemini CLI Windows下安装

我差不多是VS Code Copilot的第一批用户，Copilot的问题在于仅能处理有限的页面（通过引用文件的方式），而不能很好地理解整个项目。除此以外，如其名称一样，它更多像是一个辅助编程的助理，自主编程的能力差一些。今年Claude Code发布后， AI工具可以自行编码了，但它不仅收费高昂，而且限制大陆地区的注册和付费。随后，或许是为了竞争，Google推出了Gemini CLI，几乎是Claude Code的平替。于是迫不及待试用了一下，本身安装Gemini CLI应当是一件很简单的事情，官方也已经有详尽的文档。然而，由于墙的问题、Google验证的问题，还是费了一番周折。这篇文章简要介绍了在windows 11上安装Gemini的步骤。

阅读: 2471 发表: 2025-06-30

Streamlit 英译中AI助手

自从有了大模型之后，阅读英文的技术文档再也没有了任何障碍。现在大模型的翻译水准，相比我自己的翻译，有时候甚至更加准确。于是，现在浏览英文文档，操作完全是ctrl+C/V，复制到元宝等大模型工具中，翻译后直接看译文。

阅读: 597 发表: 2025-06-28

LlamaIndex 提示词模板

在LlamaIndex中，不论是构建索引、提出问题，还是合成响应结果，都会用到提示词。只是在默认情况下，对于用户而言，没有感知罢了。这篇文章将简单介绍LlamaIndex中提示词的使用方法，从而加深对于LlamaIndex的理解。

阅读: 662 发表: 2025-06-27

Streamlit 聊天窗体界面

上一篇《Streamlit 页面处理流程》中简要介绍了 Streamlit 页面的处理流程，接下来我们就看一下如何使用 Streamlit 构建一个常见的AI聊天窗体界面。这篇文章的代码源自Streamlit官方文档（Build a basic LLM chat app），额外使用了container空间。

阅读: 710 发表: 2025-06-18

Streamlit 页面处理流程

截至目前，所有和大模型相关的范例，都运行在本地的控制台上。但在实际的应用场景中，很多时候是以对话窗口的形式，通过网页UI来进行交互，提出问题，显示结果。开发网页，涉及到前端的Html、CSS、JavaScript 等许多的开发，这部分虽然属于“非核心”部分，但同样需要花费掉不少时间。除此以外，开发RAG应用，其前端UI和交互大同小异，个性化程度不高。因此，Streamlit应用而生，它特别适用于开发数据应用，使用纯后端python脚本，生成web界面，使得开发人员可以专注于数据的检索和应用。

阅读: 904 发表: 2025-06-17

LlamaIndex 概念解析

LLamaIndex 采用一种被称为“逐步揭示复杂性“（progressive disclosure of complexity）的设计原则。基于这个原则，完成一个任务，只需要短短的几行代码就能够实现。然而，如果需要对任务进行一些配置，或者实现一些更深入、更细致的功能，就需要对组件进行自定义，或者添加更深入的配置。此时，对于相关概念和组件的理解，就显得尤为重要。因为LlamaIndex涉及了相当多的概念，针对这些概念官方站点上又提供了上百的示例程序，所以想要深入理解和掌握仍是有一定难度的。本文将从定义和作用两个方面，对LLamaIndex的核心概念进行阐述。本文的内容，大体上是：官方文档、AI模型问答、《Building Data-Driven Applications with LlamaIndex》，以及我个人理解的综合。

阅读: 1022 发表: 2025-06-15

Building_Data-Driven_Applications_with_LlamaIndex

此轮全球AI大模型的火爆，始于2022年11月的ChatGPT的发布，时间只有2年多，相关的应用和开发也才逐步展开。而像LlamaIndex这样的框架，也是2023年才开始出现，本身仍处在快速的迭代之中。因此，学习LlamaIndex的主要方式，仍然是 LlamaIndex的官方文档和示例。但是，从官网学习的主要问题，在于对初学者不够友好，概念众多，相对没那么好理解，系统性也有所欠缺。于是，按照通常的学习方式，我在网上搜索了LlamaIndex的书籍，然而，当前市面上没有一本中文书。英文书籍，也仅有两本，此书便是其中一本，出版于2024年5月。

阅读: 686 发表: 2025-06-12 推荐:

LlamaIndex 查询本地html文件

除了纯文本、CSV等格式以外，常见的数据格式还包括网页，也就是html文件。网页文件，又可以分为本地文件（预先下载好的，或者本身就存于本地），以及直接通过url地址访问（当前的很多大语言应用，例如腾讯元宝，都支持网页搜索）。这篇文章将介绍，如何使用LlamaIndex加载本地的html文件，并进行解析。

阅读: 757 发表: 2025-05-30

为什么互联网这么卷？

这篇文章节选自公司内部的一次会议，感觉可能对其他人也有帮助，就分享了出来。因为我本身就职于游戏行业，所以文中的很多例子是以游戏行业为主，但也适用于大多数互联网行业。如果进行转载，请注明出处和作者。

阅读: 797 发表: 2025-05-19

LlamaIndex 查询csv文件 - Part.1

默认情况下，我们使用 SimpleDirectoryReader 加载文件时，是以纯文本的方式读取的。很多时候，我们面对的文本格式是多种多样的，例如常见的：PDF、CSV、HTML、Word、Json。这些文件类型，要么在存储时压缩了信息，例如CSV（将公共属性压缩在了首行）；要么加入了额外的标记，例如: HTML（添加了诸如h1、p、div等标签）。如果按照默认方式加载，这些文件都将会被作为纯文本处理，这可能会在查询时产生错误的结果。本节将介绍，如何正确地加载csv格式的文件。

阅读: 921 发表: 2025-04-30

LlamaIndex 使用Chroma作为向量数据库

在 LlamaIndex 构建本地文件向量数据库当中，我们将由文本转换的向量数据保存在了本地的文件目录中，这种方式适合于小量的数据。如果数据量较大，那么可以使用更专业的向量数据库，例如开源的 chroma，这篇文章修改了前面的例子，演示如何使用chroma来保存向量数据，并执行查询。

阅读: 1246 发表: 2025-04-29

LlamaIndex 查询本地文件

在上一篇文章中，我们已经构建了本地的文件向量数据库，并对其进行了查询。但对于小型文件，或者仅执行一次的查询而言，这种方式又显得比较繁琐，因为它分为了两个步骤，且在本地生成了vector向量数据库。对于临时查询而言，这个文件夹就相当于“临时文件”了。本文延续上面的例子，只不过不在本地创建文件向量库，而是对文件进行直接查询。

阅读: 728 发表: 2025-04-29

LlamaIndex 构建本地文件向量数据库

在 LlamaIndex 使用大语言模型这篇文章中，我们介绍了使用LlamaIndex直接对大模型进行提问，并输出结果。在本篇以及后续文章中，我们发挥LlamaIndex的专长，构建RAG，来对本地的私有文档进行提问。这篇文章中，我们先进行第一个步骤：构建本地的文件向量数据库。

阅读: 1077 发表: 2025-04-28

OpenAI 生成吉卜力风格的图片

最近OpenAI再一次火了一波，因为它推出了原生多模态图像生成模型。这种模型在训练时直接混合多模态数据（如图文对、音视频同步数据），建立模态间语义映射，统一处理多模态输入输出。直观上，就是提供一张图片，同时配上需求，例如：将这张图片转为吉卜力风格，模型即可自动完成。当前支持最高1024x1536的分辨率，费用大约0.2美元/张。这篇文章将讲述如何实现这一过程，之后就可以将自己喜欢的相片转成吉卜力风格啦。

阅读: 940 发表: 2025-04-28

LlamaIndex 使用大语言模型

随着 GPT、Deepseek、Claude 等 LLM（Large Language Model，即大语言模型）的推出，很多人也都通过豆包、元宝、Kimi 等大厂的应用，开始使用这些模型来协助工作。但是，这些应用都有一个共同的问题：只能基于历史的训练数据，或者借助网页搜索，根据公开的知识来回答问题。人们迫切的需要，将自己私有的数据，例如个人知识库，告诉给 LLM，让LLM可以基于此回答问题。通常，有三种方案可以达成这个效果。

阅读: 1043 发表: 2025-04-27

2FA认证的实现原理

近期，越来越多的站点使用2FA进行网站的登录验证，例如被广大程序员所熟悉的github。这篇文章就来介绍一下2FA的实现原理。

阅读: 1113 发表: 2025-04-15

1 2 3 4 5 6 7 8 9 10 > >>

共 311 条记录当前显示 1-20 条