合作专线:17362615757
行业资讯

AI科技

当前位置:首页 > 行业资讯 > AI科技

“的爱装了X”开源软件组织一:“如教科书级水平”AI知识树究竟长的什么样子?


作者 | Just
出品 | AI科技大本营(ID:rgznai100)
你看了很多本人工智能的入门书籍,但发现还是不能有效的将它们有效分类连接,进行结构化表达,因为知识点在你的大脑中是碎片化的,一片混乱。 最好的方式是以一本书为主干,然后利用其它书籍进行补漏查缺。但是,如果你自己整理,肯定需要花费很长时间,因为每本书的有些内容是重复的,不重复的内容如何分类填补也并不容易。 不要紧,只要你动动手,在网上我们总能找到这样的资源。现在,已经有人为你做了整理和筛选工作。开源社区 ApacheCN 的成员将人工智能入门疏解的每本书的章节拆开,再按照知识点合并,手动整理了人工智能知识树。你可以按照知识点依次学习,如果理解了一个知识点,就没必要再去查看其余文章。 这份人工智能知识树 v1.0 是整理了从零到一的学习内容,主要包括统计机器学习、深度学习、时间序列、机器视觉、图嵌入/图的表示学习、自然语言处理、强化学习、推荐系统、处理/特征工程、模型评估/模型调优、最优化以及其它学习笔记十二部分内容。 以统计机器学习部分为例,主要划分为基础知识、线性回归/逻辑回归/softmax 回归、决策树/随机森林、GDBT/XGBoost、朴素贝叶斯、支持向量机、K 近邻、KMeans 等 19 个知识点。


再比如深度学习、时间序列、机器视觉等内容,知识点涵盖非常全面,实打实地属于“看这一本就够了”。      
获取资料的 GitHub 地址看这里:  当然,ApacheCN 中不止有人工智能知识树 v1.0 这一份资料,除了人工智能学习资料外,该开源组织还整理了算法刷题训练指南、scikit-learn 中文文档、kaggle 项目实战教程以及 PyTorch 中文文档。  
如果你想找系统化梳理的人工智能学习资料,ApacheCN 整理的内容一定会给你惊喜。 官网地址: 最后,大部分开源组织其实都是一群在免费资源背后默默付出,为开源世界做着力所能及的贡献的人,而不是机器和程序。套用一句时髦的话就是,他们也应该拥有姓名。 这次,AI科技大本营特意采访了 ApacheCN 的创始成员,他们说 ApacheCN 是一个“国内第一个有组织性、敢带人装X、敢真的分享、并且敢戴绿帽的中文开源组织。”像所有的开源组织一样,我们希望他们能被更多人知道,走得更远。 1、简单介绍一下 ApacheCN?
ApacheCN 是 2016 年 8 月份就开始搭建网站雏形, 2017 年 6 月份正式全职来做,是国内第一个有组织性、敢带人装X、敢真的分享、并且敢戴绿帽的中文开源组织。        
成立 ApacheCN 是因为国内 AI 方面(包括但不仅限于 AI 方面)的资料过于贫乏,大多零散且维护滞后,有明显的学习门槛 。大牛们的分享往往要么过于表面,要么充斥着大量的专有名词难以理解(P.S.:尽管 AI 方向确实存在很多专有名词,但是我们还是希望能够让它更易于理解)。另外,国内知识付费的门槛又很低,很多低质量的知识在大肆收割智商税的同时,高质量内容无人问津,正是这种劣币驱逐良币的现象,让我们萌生了建立一个高质量、公开且具有活力的社区。 我们现在的组织架构一个是完全个性化安排,团队成员负责喜欢的方向,只要对学习有帮助,组织就全力支持!),另一个是换届制管理,由于开源人才的流动性大,避免死海现象,开源更适合这种模式。 内容方面的话,主要以兴趣、工作、权威和需求为导向来建立标准规范。
2、 请介绍一下团队创始成员各自的工作背景?在 ApacheCN 的主要职责分别是什么? @片刻:工作 5 年从事 NLP,目前在创业公司打杂。负责组织内部稳定和协调、录制面试和求职干货。@庭哥:工作 5 年从事大数据。负责组织内部基础文档模块的雏形构建。@小瑶:工作 3 年从事 CV 方向。目前主要负责新闻资讯相关,以及配合组织内各大佬的工作。@飞龙:南理工硕士在读(人工智能方向)。负责翻译活动和媒体运营。@咸鱼:创业公司打杂。负责项目管理和产品需求,组织内负责对外合作等事宜。@算子:致力于融合人工智能与网络应用,创业中。负责组织网站平台建设。 3、 你们应该都是在空闲时间打理 ApacheCN,介绍一下大概需要做的工作?
翻译活动:需要跑脚本和处理合并请求,大概每天十几分钟。媒体运营:需要发周报,大概每个周末两个小时。群活跃:需要每天花费 1~2 个小时吧(不过都是零散时间)。内容分享:会把自己每天学习有价值的干货分享给大家(几分钟,零散时间,顺便的事情)。对外合作:目前跟其他几家平台联合搞一些事情,每周会花 5 小时左右。内容录制:晚上在家或周末,会录制一些比赛视频 or 面试简历讲解。网站平台:遇到网站需要升级完善可能要每天花几个小时,如果是日常维护每天大概花费十几分钟修补一些内容。
4、 类似的开源组织应该也有很多,ApacheCN 是否有自己特别的发展方向?
首先我们主要致力于 AI 的普及,我们认为各行各业的人都需要学习和使用 AI,AI 会在各行各业创造更大的价值。我们不会局限于现有的推广渠道,或者某些固有的传播学认知,不介意用任何增长黑客策略。为了降低运营成本,使组织持续发展,我们会使用一些工具,使各个流程数据化和自动化,让开源社区的运营就像每天刷牙洗脸一样简单。与某些有大公司背书的开源组织不同,我们不设定门槛,你只要爱学习,乐于提问和分享,那么就符合我们要求,也符合我们对开源的认知:人人都可以开源、人人都可以参与,这个时代大家智商都差不多,所以更应该有更大的包容心!(而不仅仅是秀背景和学历!)与商业组织不同,我们并不会追逐热点,或者唯利是图,而是打造真正有价值的长尾作品。我们非常在乎作品的潜在价值,希望它能帮助用户解决工作和生活上的问题,进而产生意想不到的价值。我们坚信“产品决定品牌”而不是“品牌决定产品”,并且把宣传也看成作品的一个不可分割的部分。作为一个开源社区,我们视功名为浮云,将良好的内容和宣传策略当作成功的保证。互联网上的信息大多是 混沌和稀疏的,我们秉承 “海量信息等于没有信息” ,有甄别地提供我们的内容,使用 AI、数据挖掘等技术来优化我们的流程和工具,充分利用大家的认知盈余,提供高质量的社区内容。
5、 你们的口号为什么是“不装X的人,我们都不想认识”(门槛这么高?低调且牛X的人怎么就没资格加入了:))
@平静:装X可以是一种公用属性。我们欢迎乐意分享,喜欢 AI 的成员。 @飞龙:装X实际上是“打造个人品牌”,因为成员为组织做贡献,组织反过来帮助成员,这样才能形成正反馈,持续发展。例如,组织帮助成员打造个人品牌,提高身价,成员会更乐意,或更有能力为组织做贡献,这是件双赢的事情。“装X”这个词是非常有号召力的,设计口号的时候,我们发现把它换成任何一个词,都不如“装X”好。 @大鱼:最好的装X一般是无形的。比如说,如果我们为流程的某个环节写了一个辅助工具,我们不会说“我们非常厉害,为某个活动特此设计了工具”,而是说“我们不是很厉害,没找到业界通用的工具,于是自己做了一个”。 @算子:一切为了X格。 @张一极:为了知识和技术的传播,我们选择一直(装X?)。 @扬帆起航:坚持把技术传播下去,时间一长也就成了装X大佬。 @片刻:装X是一种乐于分享的姿态,就像别人总说:片刻大佬,好装X啊!其实不是说你牛X,而是说你愿意把你牛X的东西分享给大家,大家对你的认可的方式!(我们群有一个烦焖鸡老哥就是默默无闻,没事就分享一些笔记资料和回答问题,然后下面小老弟各种拜膜) @小瑶:怀着装X的心去吹牛X多爽!吹牛X人人都会吹,但我们与他们的不同是,我们不仅仅会吹牛X,还会把吹出去的牛X,实现并且做到能力所及的最好,这何尝不是一种装X?跟着我们走,你会发现你的吹牛X能力增长迅猛,装X的心也会越来越大。。。只要你想变强,内在心理是装X的,那就能加入,哈哈。 @蛋黄:常与同好争高低。再低调牛X的人,在自己的领域,也会有争胜之心。讨论和交流,才会产生真正有价值的东西。 @庭 : 一个人可以走(zhuang)的(bi)很快,一起却可以走(zhuang)的(bi)更远 。。。
6、 ApacheCN 现在的运营状态如何?团队日常的运营和维护费用是怎么解决的? 我们拥有一个日 UIP 4k 的网站(流量相当于 RubyChina 或 1/30 个 OSChina),广告收入能够抵消服务器的开销。我们没有在推广方面花过钱,所有渠道都是成员自带,或者一点一点做起来的。当然,我们目前也仅仅是能够自收自支的状态,谈不上盈利。 7、 作为一个开源组织,你们目前需要什么来自外界的帮助? 期待公益基金赞助: 100万元/2年。主要用途:1.组织员工基础工资;2.对贡献者的奖励;3.基础的服务硬件。希望通过我们的汗水,给更多的人学习带来更便捷的知识财富。
8、 关于 ApacheCN,还有什么想说的?
我觉得我们真的没什么特别的地方,我们都是一群普普通通的一群爱吃辣条、爱分享的人,我们没有靠什么背景,也没有什么资源,分享的东西也没有多么牛X,甚至我们分享的教程、比赛、也没有得过什么大奖(当然群友有一些牛X的),但我们是真心愿意高标准要求自己,低姿态接纳小白,把学到的知识真心的去分享给他们、帮助他们、让他们少走弯路,并带他们一起牛X。 虽然在 GitHub 上面被网友力推,得到全球组织排名 119,我感觉的只是我们愿意奉献而已。期待更多的人加入 ApacheCN 或者和 ApacheCN 一起推动国内的知识开源,让开源更健康成长。 最后还要感谢组织内部乐于分享者、各种渠道方式的受众、还有那些默默输送资源、背后维护平台稳定和发展的美女靓仔们。
◆精彩推荐◆


推荐阅读不得了!这个 AI 让企业家、技术人员、投资人同台“互怼”
各方最新回应!如何看待IEEE官方声明“学术禁令”?
数据可视化,还在使用Matplotlib?Plotly,是时候表演真正的技术了(附代码)亮风台新提端到端AR投影光学补偿算法 | CVPR 2019 Oral代码整洁之道-编写 Pythonic 代码谷歌临时工达 12 万,外包程序员的出路在哪里?直接拿来用!灵跃模组机器人硬核评测(编程篇)这些方法解决了数据清洗80%的工作量 | 技术干货敲代码时,程序员戴耳机究竟在听什么?敲诈团伙将黑手伸向宅男, 你在家看不可描述的视频, 竟被骗走100万美元!

点击阅读原文,查看更多精彩内容。
粤ICP备19111974号