1. 1. 信息论
  2. 2. 海量数据的收集与过滤
  3. 3. 我的阅读系统
    1. 3.1. 一次筛选
    2. 3.2. 二次筛选
    3. 3.3. 三次筛选
    4. 3.4. 四次筛选

搭建高效的碎片化阅读系统

摘要:现代人对信息的渴求就像原始人对热量的追求一样,一昧的追求过载的信息就像肥胖人群不加掩饰对原子的贪婪,我们自以为随着科技的发达,人类的也会进化的文明起来,然而面对免费的比特世界,在虚拟进程的世界中,人类尽情的展示出的对一切事物的无求无尽的占有的欲望,现实世界中以物物交换为规则建立起来的人类社会在互联网思维下荡然无存,网络的原著民他们早已习惯了不对称的获取,然而过量的信息没有让他们变得更加聪慧,却像难以行走的胖娃娃,过量的热量会以人类追求的对立面将人类毁灭,信息也是。

信息论

字典中“噪”是指那些对人类行为过程不产生价值的信号,例如“噪声”指的就是“不需要的声音”,诚然一切从源发出的信号都是不带有偏见的,信号的价值只取决与信号的接收者对信息的灵敏度。“信噪比”(SIGNAL-NOISE RATIO)似乎能够很好的衡量客观衡量信息可利用的程度,然而从信息接收者的一方来看衡量信息价值的永远是需求,即当我们需要查找一类信息是就会对一些信息超敏反应,而对其他信息直接采取屏蔽措施。

据说大脑中90%的信息来自视觉神经的输入,正所谓“一图胜千言”,眼球的一幅画面所携带的信息远大于其他感官的信息输入,然而大自然鬼斧神工的眼球有一个致命的缺点就是它是需要对焦的,人类无法一次性获取全部映射如视觉神经细胞的光信号,我们看上去可以一次性获取一个画面,但是将眼前的画面分成9块,也就只剩下中间的那块是清晰可见的,而如果尝试一次性捕获整个视野就会发现全局失焦,当我们看一本书时,即使我们同时捕获了整页的文字,我们也难以获取其中的信息,即使我们有了高能力但是面对文字时依旧无能,而快熟的阅读一篇文章,我们依旧无法很好的获取其中信息,总的说大脑就是一台性能不均衡的电脑,带宽很高倒是快熟缓存系统简直糟糕透了,所以阅读可能并不是人类获取信息的最佳渠道,然而它是唯一最为直接能够确保信号不失真的途径。

声音是一种更接近自然的方式,当我们还是小孩纸的时候,即使不识字也可以清晰的通过声音还映射物体,但我们在阅读文字时我们会将文字脑读一遍,再将声音格式的信号储存在大脑中,当我们需要从大脑中读取音频信息后转化为字节信号,声音途径的另一个好处就是它的输入频率是非主控的,我们阅读文本时我们必须主动的控制信息的输入频率,也就是说,阅读文本是主动的,而声音是被动的,当然我们看东西是一个被动的过程对焦则是一个主动的过程,而主动则是一个耗能的过程。

同样身体各个器官都具有对焦的功能,因为对焦的过程是在大脑中进行的,对焦的过程其实是对信息权重的判断,忽略大多数的信号而只进行单线程的目标信息扫描,所以不难说塑造我们人生观世界观的其实是我们需要的信息。

海量数据的收集与过滤

信息是当今时代的货币,处理海量信息的能力决定每个人的成效。处理的第一步,是要选定关心的领域,进行信息收集。其实我觉得“收集”这个词未必准 确,“收集”有主动出击的意思,但我认为,最好是能让信息自动出现在你面前。RSS 订阅,电子邮件,豆瓣友邻都有这样的功能。例如我感兴趣的领域包括计算 机科学,数学,心理学,人工智能。我会通过 RSS 订阅相关的博客,我在豆瓣上关注有共同兴趣的牛人,而我的电子邮件可以收到一些邮件列表信息或是电子杂志 (如 Toplanguage 讨论组,新语丝)。这样,我不必主动去“收集”信息,而是让信息自动聚合到我眼前,由我定期检阅,这样的好处当然是省时间,而 且便于以自己的节奏进行信息批处理。

收集信息倒不难,难的是怎样过滤信息。这里有一个前提假设,就是得到准确的信息比不准确的信息好,这点我想只要不是发神经的人,不会不同意。暂且不 论信息质量的高低,就是得到准确的信息很多情况下都不是那么容易的。拿政治信息来说,网民搜集资料多方猜测,可能到最后都是意淫,但在上面的人只要想了解 就很容易得到准确的信息(至于他知道信息后采取什么行动是另一回事)。Google 到底有没有被中国黑客入侵?我们根本不清楚,但上面的人一定有准确的信 息。在任何一个领域中,处于领导地位的人都很容易获得他所需要的信息,这些人我称为信息中心。

因此,要更高效地得到准确的信息,只有两种方法,一是近量与信息中心接近。比如你想多了解金融信息,就认识一些在这个行业工作的人,而不是光靠新闻 媒体这种滞后又不一定准确的信息。另一个方面就是和与你有同样需求的人结成圈子,比如大量股民,这样通过 P2P 的方式,使得信息可以大量流通,缺点是垃圾信息太多,必须花心思选择信息质量高的圈子。

没有一种方法能保证你获得是准确而又高质量的信息,以上方法只能增加你获得准确信息的概率。最终对信息的筛选还需要你的判断力。但好的方法可以极大 减少你的工作量,使得到你眼前的信息已经是经过筛选的了,比如 Google 搜索的结果,事实上就是根据到这个页面的链接多少来排序的,于是呈现的结果本身 就是一个已筛选的结果。又比如想学习某个主题,可以看看某个牛人推荐的书籍,这便是牛人已帮你预筛选的信息了。
上面说到,由于信息不对称,有些信息只对这个领域的中心人物公开。但有一个领域例外,就是学术界,这个领域是以分享知识为宗旨的,所以所有的信息都是公开的,你可以很容易接近信息中心,里面的信息质量也非常高(如科学实验大都设计得非常严密),善用学术领域的研究成果我认为是最大的信息杠杆,而且学 术界已经帮你筛选信息了,比如设计不严密的实验无法在有头有脸的学术期刊上发表。困难的是学术文章普通大众未必看得懂,但科普杂志和学者的博客、书籍也差 不到哪去。所以我强烈建议大家有空多看[科学松鼠会]和《环球科学》杂志,里面的信息不但质量高,也和我们的生活密切相关。比如,通过阅读这些信息,你能 很清楚地知道人类医学对各种疾病的攻克情况,而且你能确定这些信息是准确的,这样,你就不会被江湖上的神医和电视上的神药忽悠。

以上所说的方法等于是对所收集信息的第一轮筛选,其实这很重要,经过第一轮筛选后信息已经被精简了90%,我的 Google Reader 上每天新条目不超过20条,且其中的50%都能让我受益。之后的第二轮筛选只能靠你个人的判断力了。

判断力这东西说来含糊,说白了就是你要有一个框架,让你能判断信息的真伪和重要性。框架就是你判断事物的一些抽象的规则,正是因为抽象,所以它们简 洁而适用范围又广,比如为什么我不会被非法传销骗?因为我有一些简单的经济学原理知识,如果一个行业门槛很低,又宣称加入进来的人收入很高,那这行业如果 不是夸大宣传,就是有非法收入。于是如果这个组织进一步让你交“会员费”之类玩意的时候你就得格外小心。这个“投入很少收益又奇高”的规则可以帮助我筛选很多信息。比如24小时学会 XXX 之类的书,以及所有速成类的广告。

我的另一条判断规则,就是好书基本上每页都好,烂书基本上每页都烂,好的作者基本写出来的都是好东西,反之亦然。因此如果一个信息源一直产出垃圾信息,那你也别对它有指望了。比如各类伪科学作品。

我个人主要关注信息的准确度和质量,并不太关注信息的新鲜度和频率,比如刘未鹏的 BLOG 更新频率很低,但每篇都很有价值。对我来说,一个信息延迟 一些知道是没什么损失的,因为我现在的主轴是阅读经典。这就是为什么我不用 twitter 和校内(偶尔还是会看看朋友们的近况),因为它们的信息质量和准确度太低了。其实对大部分人来说,信息的新鲜度都不是那么重要。

我的阅读系统

我的阅读系统

一次筛选

以前我看到好的网站,或者博客,都是放到浏览器收藏夹就算了,然后每天都把收藏夹里的网站刷一遍,然而这样做的坏处就是每次都要打开各种样式不同的页面,其次有的页面没有适配移动端,移动设备的体验非常差,而电脑显然不是一个优秀的阅读设备。尤其是各类独立的新闻媒体阅读体验并不良好,字体的排版还是 CSS 样式都让人有种浪里淘金的挫败感。还有就是这些站点会和收藏的其它页面混在一块,网页堆积过多了之后就会出现找不到的情况,而且网页的剪辑检索保存缺乏良好的用户体验,通常看完后需要再次检索就很难查找到了。
于是我尝试将这些网页通过 RSS 订阅聚合到 Feedly 再在移动端使用 PRESS 进行阅读,这样可以保证所有页面的阅读体验一致,PRESS 的排版非常优秀,再搭配上稍后阅读软件 POCKET,笔记本工具 Evernote,用户体验非常良好,而起可以做到跨平台同步阅读进度。
后来发现网站和博客在 Feedly 里慢慢积累多了,新闻信息和工具类文章数量不平衡,全部挤在一起一片混乱,大大影响了阅读质量。于是参考了几位效率达人的方法,沿用了一个我比较喜欢的,就变成了现在的分类模式:

  1. 最重要
  2. 一般重要
  3. 不重要

这个是按照“你所关心的资讯”的重要程度来编排文件夹。将你觉得最关心、每天必读的源放进1;将一般般的资讯,如普通新闻类,甚至微博放进2,一般这类文章都是在坐车、等人之类碎片时间来阅读。将不重要的或者数量巨大的 Feed 放进3,这些 feed 一般是鸡肋,弃之可惜的就放进去吧。
之前我还短暂的按照另外一个方法来分类,就是按 Feed 的属性建立文件夹。这样就大概成了这样:

  1. GTD
  2. Marketing
  3. Porject Management
  4. IT News

    短暂尝试之后,发现这方法虽然直观但是效率不高,因为每个类目里面都有各种质量的 feed 或者内容文章,在进入文件夹之后还要下意识地查找比较有营养的资讯,有些没用的文章要点击进去看过才知道,这样操作等于多了一个步骤。如果按照重要程度来分类,基本进去第1个”最重要“文件夹就可以放心细读文章了。
    按照重要程度来分类有一个基本要求,就是你对你收集到的各类 Feed 都有深刻了解,你不了解 Feed,你就不知道它是否重要了。

二次筛选

其说 PRESS 是一款 RSS 阅读器,倒不如说是一款第三方的“RSS 客户端”,Press 的登录伊始就需要选择导入 Feedly/Feed Wrangler/Feedbin/Fever 的账号中的一个,所以在使用 Press 之前,记得先调教好以上的那些 RSS 服务商,因为在 Press 里,你并不能随便的添加订阅源。
好在即使是一款第三方的 RSS 客户端,Press 也给了我绝对不一样的使用体验,简单的导入过后,看起来极为精致的 UI 设计就以让人爱不释手,深灰色的背景非常的养眼,而酒红色的 icon 在其中轻盈点缀,让人忍不住就想去触摸它。

当然极为简约的阅读界面也是我的最爱,里面见不到杂乱无章的元素,只有右上角的已阅读/加星标/分享按钮孤独的矗立在那里;觉得文章好极了你还可以扔到第三方的稍后读服务中详细阅读,操作起来也极为简单:只需要触击正文下方的状态栏,一键发送到 Readablility。此外,在下方还提供了 Readablility 一键网页排版优化,力保每一篇文章都能轻松获得最佳的阅读体验。

选择 RSS 阅读器这个步骤,我建议必须选择要有分享到”Read it Later“、Evernote 之类服务的功能,要不无法满足我后面的筛选需要。我试用过有类似功能的 app(iOS 端)包括:Reeder,Newsify,还有一个国人做的叫 yReader。这个 yReader 我个人也是非常喜欢,分享功能齐全,操作非常方便,只是觉得 UI 和文章排版布局我不太满意,但也是非常值得使用的一款 Google Reader 客户端,各位看官可以支持一下国人的精品。

选择好了自己的阅读器之后,如果你看完了一篇很好的文章,以发送到 Evernote 来存档。如果发现有些文章不必现在就读,可以在稍后的碎片时间里阅读;或者有些好文觉得必须多看一次,但是不是现在重新读一次,那就发送到提供“Read It Later 稍候读”服务的 Pocket 里面吧。

关于“3. 不重要”这个文件夹里面的无用资讯,按照一位达人所说,如果积累太多,要狠狠地将它”Mark All As Read“,不要手软。如果其他文件夹也严重积累未读,你又确实连浏览标题都没时间,那也需要狠狠地来一下。因为人的惰性很恐怖,越多积累着的文章未读,你会越不愿意打开它的。这点真的很重要。

三次筛选

Read It Later 这个服务非常好,可以帮助你把精品文章保存起来多读几次,或者 timing 不合适留着晚点再读,或者就是喜欢它的排版干净纯粹,让人专注于阅读。关于这个我写了一篇关于该服务的文章,大家可以参考一下 《Read It Later 稍后阅读之 Pocket、Readability》。

因为我整理文章到 Evernote 归档的时间段是1周至2周,有时甚至更晚,所以需要在稍候读这个阶段进行文章筛选分类。要不当我发现稍后读服务里面积累了几十篇文章,要找到自己想看的类别就很辛苦了。

这里推荐使用 Pocket,因为他能简单的为文章加 Tag 进行分类管理,操作直观,而且 UI 和字体排版都很不错。Instapaper 的话也能把文章分类管理,但是不够 Pocket 纯粹,个人习惯问题我就舍弃了它。

具体操作例如我在 Pocket 里收集了关于 GTD、项目管理、生活趣闻等类别的文章,我就把这些文章标记上相应的 tag,想看哪个类别的就选哪个。很简单。

没收藏价值的文章,看完了之后直接标记”Archive“就可以放进已阅档案夹,pocket 会替你好好保存,以后还可以翻出来。
有价值的文章可以用 Pocket 发送到 Evernote,发送的同时你还可以选择填写该文章在 Evernote 里面所属的标签,这个步骤在 pokcet 里面可以选择省略,同时,在 Chrome 浏览器中看到的好文章也可以通过 Evernote 插件 Clearly 保存到 Evernote 中。

四次筛选

每周通过 P2K(p2k.co)服务将 POCKET 中高质量的文章推送到 Kindle 保存以随时阅读,在加上 kindle 上的海量电子书可以满足信息的基本阅需求。