张子阳的博客

首页 读书 技术 店铺 关于
张子阳的博客 首页 读书 技术 关于

最新内容

文章: 298

阅读: 1142832

今日阅读: 350

今日访客: 299

LlamaIndex 查询csv文件 - Part.1

默认情况下,我们使用 SimpleDirectoryReader 加载文件时,是以纯文本的方式读取的。很多时候,我们面对的文本格式是多种多样的,例如常见的:PDF、CSV、HTML、Word、Json。这些文件类型,要么在存储时压缩了信息,例如CSV(将公共属性压缩在了首行);要么加入了额外的标记,例如: HTML(添加了诸如h1、p、div等标签)。如果按照默认方式加载,这些文件都将会被作为纯文本处理,这可能会在查询时产生错误的结果。本节将介绍,如何正确地加载csv格式的文件。

阅读: 35 发表: 2025-04-30

LlamaIndex 使用Chroma作为向量数据库

LlamaIndex 构建本地文件向量数据库 当中,我们将由文本转换的向量数据保存在了本地的文件目录中,这种方式适合于小量的数据。如果数据量较大,那么可以使用更专业的向量数据库,例如开源的 chroma,这篇文章修改了前面的例子,演示如何使用chroma来保存向量数据,并执行查询。

阅读: 38 发表: 2025-04-29

LlamaIndex 查询本地文件

上一篇文章 中,我们已经构建了本地的文件向量数据库,并对其进行了查询。但对于小型文件,或者仅执行一次的查询而言,这种方式又显得比较繁琐,因为它分为了两个步骤,且在本地生成了vector向量数据库。对于临时查询而言,这个文件夹就相当于“临时文件”了。本文延续上面的例子,只不过不在本地创建文件向量库,而是对文件进行直接查询。

阅读: 30 发表: 2025-04-29

LlamaIndex 构建本地文件向量数据库

LlamaIndex 使用大语言模型 这篇文章中,我们介绍了使用LlamaIndex直接对大模型进行提问,并输出结果。在本篇以及后续文章中,我们发挥LlamaIndex的专长,构建RAG,来对本地的私有文档进行提问。这篇文章中,我们先进行第一个步骤:构建本地的文件向量数据库。

阅读: 47 发表: 2025-04-28

OpenAI 生成吉卜力风格的图片

最近OpenAI再一次火了一波,因为它推出了 原生多模态图像生成模型。这种模型在训练时直接混合多模态数据(如图文对、音视频同步数据),建立模态间语义映射,统一处理多模态输入输出。直观上,就是提供一张图片,同时配上需求,例如:将这张图片转为吉卜力风格,模型即可自动完成。当前支持最高1024x1536的分辨率,费用大约0.2美元/张。这篇文章将讲述如何实现这一过程,之后就可以将自己喜欢的相片转成吉卜力风格啦。

阅读: 56 发表: 2025-04-28

LlamaIndex 使用大语言模型

随着 GPT、Deepseek、Claude 等 LLM(Large Language Model,即大语言模型)的推出,很多人也都通过 豆包、元宝、Kimi 等大厂的应用,开始使用这些模型来协助工作。但是,这些应用都有一个共同的问题:只能基于历史的训练数据,或者借助网页搜索,根据公开的知识来回答问题。人们迫切的需要,将自己私有的数据,例如个人知识库,告诉给 LLM,让LLM可以基于此回答问题。通常,有三种方案可以达成这个效果。

阅读: 49 发表: 2025-04-27

2FA认证的实现原理

近期,越来越多的站点使用2FA进行网站的登录验证,例如被广大程序员所熟悉的github。这篇文章就来介绍一下2FA的实现原理。

阅读: 122 发表: 2025-04-15

简约至上:交互式设计四策略

一直对产品设计保持兴趣,也经常会去发现日常生活中让人眼前一亮的巧妙设计,而遇到一些给人带去不不便的拙劣设计,真是恨不得把产品设计者喊到眼前臭骂一顿。因为我比较崇尚简单和有效的设计,这本书的书名首先打动了我,于是就买来读了。书不厚,分为了两部分,7个章节,前面3章,讲述了一些简约设计的理念,并提出了简约设计的基本方法:删除、组织、隐藏和转移。而后面4章,以电视遥控器为例子,详细讲解了如何实践这4种策略。书中配了很多有意思的插图,有些可以说是:一图胜千言了。

阅读: 771 发表: 2024-11-19 推荐:

接口测试方法论

部门有一个小小的测试团队,其中的两位测试成员大部分时间都在做一些鼠标点点点的功能测试。因为公司短期内不会招聘高级的测试人员,所以暂时也没有人能帮助她们获得提高。而我本身,则一方面想要提高对于测试的认知;一方面想准备一些面试高级测试人员的面试题目;另一方面,也想提升团队内部的测试水平,就找寻了一些有关测试的书籍进行阅读。测试如果细分下来,种类很多,可以分为白盒测试、黑盒测试;可以分为功能测试、接口测试;可以分为单元测试、集成测试;可以分为冒烟测试、回归测试;还有 灰度测试、性能压测 等等。因为我们现在采用的是 客户端/服务端 分离的架构,对于客户端,可以做一下功能测试;而对于服务端,除了开发人员自测以外,则可以做一下接口测试。

网上测试方面的书不算太多,针对接口测试的就更少了,这本书的书名比较匹配我的需求,就买来读了一下。读完感觉这本书完全就是东拼西凑出来的,和接口测试只有边缘关系,而无直接联系的知识点,比如网络协议、Python的语法、也搬过来凑成一章,占据了过多的篇幅。而核心的接口测试框架的搭建,则是浅尝辄止,介绍了如何使用request库发起http请求,并使用print直接打印结果,连测试最常用的断言 assert--都没有使用。

阅读: 760 发表: 2024-11-18 推荐:

关于工作的9大谎言

这本书也是在得到万维钢的《精英日课》栏目中听到,感觉是比较有意思,同时又比较贴合职场,于是就买来读了。这本书目前还没有简体中文版本,但有繁体版,就硬着头皮读了下繁体版。这篇读书笔记,对于书中提及的9大谎言,做了一个概述。

阅读: 1786 发表: 2024-05-09 推荐:

刘澜极简管理学

刘澜的这本管理学书,将管理分为了四大心智模型:学习心智、问题心智、关系心智 和 要事心智。通过这四大模型,讲解了很多管理学的概念,以及作者所主张的管理法则。全书语言表达也比较干练,可以说是干货满满,看完收获良多。

阅读: 2123 发表: 2024-03-20 推荐:

时间黑客:用数据分析做个明白人

之前在找关于数据分析方面的专业书籍,想查下看这个领域有没有新的图书出版,恰好搜到了这本书《时间黑客:用数据分析做个明白人》。买来看了下,发现和数据分析并没有太大相关。这是一本讲时间管理的书,而在讲时间管理以外,还着重讲述了作者早年的奋斗过程。用书中的话来说,就是普通家庭、普通院校出身,从互联网最基层的客服入行,如何从月薪1300做到年薪百万,并在深圳买房安居的。作者在写作本书之前,还出了一本专业方面的书,也是市面上为数不多的,专注于游戏运营领域的书籍:《游戏运营:高手进阶之路》。

阅读: 1963 发表: 2024-02-19 推荐:

卓有成效的管理者

这本书是彼得·德鲁克最富盛名的一本书之一。讲解如何成为一个富有成效的管理者。这本书最早出版于二十世纪八十年代,其中的一些概念已为现在所熟识,例如:当前大多数的公司,尤其是我所在的互联网行业,职员都属于书中所说的“知识工作者”,而不是传统的“体力劳动者”,因此,其管理方式也有所不同。而在德鲁克的时代,仍有很多的工作属于“体力劳动者”,因此本书很多方面讲解了对于这两类人群的不同管理方式。

阅读: 1590 发表: 2024-02-18 推荐:

权力:为什么只为某些人所拥有

最近在“得到”APP听万维钢的“精英日课(第5季)”,其中有一讲是《权力七规则》,听完后感觉很有收获,让我对权力有了新的认知,就想读一下原书,而《权力七规则》这本书目前只有英文版,中文版尚未引进。于是找同作者的其他书籍,就发现了这本更早前出版的《权力:为什么只为某些人所拥有》。这本书列举了大量的案例,较系统的讲解了为什么要追求权力、权力带给你的好处、权力的来源、怎样获取权力、如何维护权力等。

阅读: 1915 发表: 2024-02-17 推荐:

互联网广告系统

这本书是公司的一位领导推给我的,可能因为我正在负责构建公司内部的游戏发行系统,而游戏发行的一个重要渠道就是互联网广告投放。看到这本书的书名“广告系统”,和我们的相关性自然是非常高。但可惜的是,这本书对于我们的参考意义却不大。

阅读: 1626 发表: 2023-12-21 推荐:

职场跃迁的60个管理思维

这本书的作者是钱自严,之前写过一本《从总账到总监 : CFO的独家财务笔记》,豆瓣评分高达9.2。在了解这本财务书籍的过程中,发现了作者的这本管理类的书。本来我以为作者是分阶段、分步骤讲解如何在职场中“升级打怪”的,看完后发现这本书是作者职场经验的笔记和汇编。全书分为了60个独立的章节,每个章节基本都是由作者经历过的一些案例 或者 是一则小故事,引发的对于处理此类情况的思考总结。这些章节上都标注了作者的写作日期,可见作者是在职场中遇到问题后,及时记录下来,然后再进一步进行整理和润色,最终形成了这本书。

阅读: 2245 发表: 2023-09-07 推荐:

经营十二条

很早以前就看过 稻盛和夫 的《活法》一书,最近在做部门管理,重温一下如何带领团队,就又重新买了他的这本书。这本书应该算是稻盛和夫的收官之作了,此时已经90高龄,全书浓缩了他的价值观和经营理念。最主要的还是这几点:1.树立崇高的事业目的;2.持有强烈且坚定的愿望;3.付出不亚于任何人的努力。

阅读: 3091 发表: 2023-08-17 推荐:

管理的常识:让管理发挥绩效的8个基本概念

这本书的结构很简单,分为了8个章节,每个章节一个主题,对管理中必须要面对的一些主题进行了讲解,包括:管理、组织、组织结构、领导、激励、决策、计划,以及控制。

阅读: 2339 发表: 2023-06-25 推荐:

图解产品:产品经理业务涉及与UML建模

这本书的书名叫做“图解产品”,顾名思义,就是用“图”来“解构”产品经理的相关知识。作者在书中引入了大量的UML图,甚至包括类图、状态图等软件设计领域才比较经常使用的图。对大多数产品经理而言,熟悉的可能只有有限的几种,例如泳道图、流程图等。因为我本人是技术出身,看后感觉整体而言,书中的UML图可能过于细致和丰富,部分内容更应该是系统架构师的职责,对于大多数产品经理都难以驾驭,可能作者本身的技术功底不错吧。另外,作者知识面比较广,这本书干货也很多,一些章节,例如交互设计,是可以拓展成单独的书的。

阅读: 2358 发表: 2023-06-09 推荐:

主动基金投资指南

之前读过作者的两本书《指数基金投资指南》以及《定投十年财务自由》,在逛京东书城的时候,无意看到作者的这本新书。因为我实际上也并没有买入太多的指数基金,更多资金还是投入到了主动基金里,所以立即买来读了。和作者前面几本书的风格类似,这本书也是主打一个通俗易懂。书中作者还顺带推广了一下自己的投顾组合,所谓“投顾组合”,有点套娃的感觉:基金是一揽子股票的组合,由基金经理帮你选股;而现在又涌现出了海量的基金,各个基金的收益差异巨大,投顾则帮你选择基金。所以本书也有那么一点点软广的意思。

阅读: 2201 发表: 2023-06-08 推荐:
1 2 3 4 5 6 7 8 9 10 > >>
298 条记录 当前显示 1-20