26 3月

几种监督式学习算法的比较

文 / Kevin Markham:电脑工程师;热衷烹饪,痴迷戏剧,偶尔参加铁人三项运动;为General Assembly讲授为期11周的数据科学课程,在SlideRule指导学生学习数据科学,还是约翰·霍普金斯大学数据科学Coursera专项课程的社区教学助理(CTA);业余时间制作视频教程参加Kaggle的比赛。

原文链接:http://www.dataschool.io/comparing-supervised-learning-algorithms/

我所讲授的数据科学课程涵盖了该领域大部分内容,但尤其关注机器学习(machine learning。除了讲授模型的评估过程和度量方法以外,很明显,我们还讲算法本身,主要是监督式学习(supervised learning)算法。

在为期11周的课程接近尾声的时候,我们花了几个小时检查所用的课程资料。我们希望学生能够逐渐理解他们所学的东西。要掌握的技能之一就是在解决机器学习的问题时,有能力在不同的监督式学习算法中做出明智的选择。虽然使用“蛮力”(把每种情况都试一遍,看看哪种最好)的方法有其价值所在,但比这价值大得多的是能够在不同算法之间做出权衡利弊的选择

我决定为学生们组织一场比赛。我给他们一张空白的表格,列出所讲的监督式学习算法,让学生从几个不同维度对这些算法进行比较。我在网上找到了这样的表格,自己先弄一张再说,一起看看

贡献出这张表格,有两个原因:其一,它可以用来讲课或者学习下载下来拿去用吧)。其二,这张表格需要完善,人多力量大!

这张表格是集鄙人经验与研究的产物,在任何这些算法的领域,我都称不上是专家。如果你有能够改进表格的建议,给我留言哟!

  • 是否在我的这些评估中存在误导或错误?(当然啦,有些比较维度本身就带有主观性。)
  • 是否存在应该添加到表格中的其他“重要的”对比维度?
  • 是否还有其他你希望加入到这张表格的算法?(目前,表格中只有我所讲授的算法。)

我意识到每种算法的特征及相应的评价都可以基于数据的具体情况(以及数据的调优程度)发生变化。因此有人会认为试图做“客观”的比较是欠考虑的。然而,我认为作为监督式学习算法入门一般性参考,这张表仍然有其价值所在。

Duang~Duang~Duang~!

学习资源

补充说明:要做“锐推”,请点击这里,还可以来KaggleDataTau讨论!

http://www.csdn.net/article/2015-03-17/2824232

19 3月

IT部门的压力:管理、同情心以及对陌生人的友好

文 / David Wagner:在商业及科技领域10余年笔耕不辍,曾在《麻省-斯隆管理评论》(MIT,Sloan,Management,Review)做助理编辑,Enterpriseefficiency.com执行总编,还是许多顶级商业及科技咨询公司的自由撰稿人。

原文链接:
http://www.informationweek.com/strategic-cio/it-stress-management-empathy-and-the-kindness-of-strangers/a/d-id/1318657

压力会让我们更容易忽略其他人的感受,对于当今企业中的IT部门来说这是不利的。

如果你管理着一个四五个人以上的团队,那么你就要清楚压力是怎样改变团队成员之间相互回应方式的。一项研究表明,人们面临压力的时候,对于陌生人就会缺乏同情心,而不管是否喜欢这个人。在大型团队或部门中,你所管理的这些人彼此之间实际上是完全陌生的。

美国与加拿大在McGill大学共同进行的研究部分地表明,对人类和小鼠进行测试,当使用药物阻断了应激激素时,人类以及啮齿类动物显示出更强的移情作用,也就是更具有同情心。举例来说,学生被要求观看一个人正在经历痛苦,用手拿着一桶冰的场景。这些学生可能会过度估计这个人所承受的痛苦,还可能会心怀同情地去触摸自己的手。除非这些学生自己处于压力之下,否则他们不太可能感受到一个陌生人的痛苦。

那么,作为一位IT经理应该做什么呢?购买一些抗应激(抗压)药物吗?让人感到高兴的是,研究还表明,如果在测试前被研究对象与一个陌生人玩有趣的视频游戏,那么这两个被测试对象可能会更有同情心。研究人员认为,单纯地减小压力完全可以使人更具有同情心。

IT从业者们的工作地点日益分散,常常跨时区,甚至跨越大洋。自己的团队成员往往会是陌生人。即使不是,IT从业者也比以往任何时候更多地被要求在不同职能团队工作,其工作与“业务”关联更紧密,与一些陌生人一起工作。

我们经常建议信息主管和IT经理们,对IT部门进行管理的最佳方式是感知企业的痛处。对IT管理来说,管理缺乏同情心的员工是不太好。如果员工处于这样的状态,那么你很可能会听到他们取笑其他部门,对其他部门的服务意识淡薄,而且很少会主动在业务上为这些部门服务。

如果你碰巧在客场为客户提供服务,那样风险可能会更大。有些人可能不会认为在同一家公司工作的人是陌生人,但如果在压力下工作的员工去客户的办公场地办公的话,那么在他眼里一切都是陌生人。

当然,你不能总是邀请你的客户或者业务线主管来玩游戏。你必须要为自己的团队找到一种管理压力的方式。美国职业压力协会表示,25%的人认为他们的工作是压力的主要来源。百分之四十的员工称,他们的工作“非常紧张或极其紧张”。八成的人表示多少都有一点工作压力。令人震惊的是,14%的人说他们感觉像是跟同事在打架。

对工作量进行管理会对此有所帮助,稍做休息也是可以的。在合理的范围内鼓励工作的时候听音乐或者做一些有趣的事情。最重要的是,你需要帮助自己的员工注意到这个问题。这样做就很容易摆脱办公室中的流言蜚语,还有团队之间的对抗。但有时候你还需要团队静下心来,关注一下别人的需要。在驱车前往客户驻地时,你要鼓励团队成员听有趣的音乐,告诉他们在参加大型会议前要找到自己满意的位置。只要意识到压力的影响也许就足以克服其最糟的一面。

换句话说,对你的团队要带点同情心。他们最需要快乐的时候让他们开心,当你最需要合作的时候,他们会展现出自己最好的一面。你怎么看呢?在你的管理方式中,同情心是否是其中的一部分呢?你又如何给自己的IT团队缓解压力呢?你是否认为你的团队成员在公司内外可以对陌生人多一点同情心呢?

04 3月

Open Cloud 2015 to focus on technology innovation and applied practice

大会包含“2015 OpenStack峰会”,“2015 Spark技术峰会”,“2015 Container技术峰会”三大技术峰会及多场深度行业实战培训。主题聚焦技术创新及应用实践,讲师荟萃了国内外真正的云计算专家。 这里都是一线接地气的干货,扎实的产品、技术、服务和平台。Open Cloud 2015,懂行的人都在这里

A total of three Technology Summits including “OpenStack APAC Conference”, “Spark Summit China” and “Container Conference 2015”, and more industry experience in-depth training, bringing together worldwide leading experts in cloud computing, aims to provide a genuine technical feast by discussions over products, technologies, services and platforms. Open Cloud 2015, THE EXPERTs ARE HERE!

02 3月

可穿戴设备制造商们,这才是今年我们想要的产品

原文链接:http://venturebeat.com/2015/01/06/hey-wearables-makers-heres-what-we-expect-from-you-this-year/

文 / Elliott Chenger:移动平台开发人员,热衷于使用新兴技术构建连接彼此的产品。

2015年了,我对可穿戴设备有了更多的期许。虽然现在这些设备可以记录我走路,睡觉,消耗的卡路里还有心率,但是我仍然被那些在我看来没有意义的数据弄得不知所措,搞不懂这些可穿戴设备到底能给我带来什么好处?

就拿Jawbone Up24这款智能手环来说吧,我是很喜欢的。它能够记录我的行踪,睡眠,饮食,甚至是聪明程度(哈哈,我开玩笑的,这个不能滴)。但所有的这些功能只是告诉你正在干什么,却没有说你该如何进行调整及其原因。比如这手环自带的应用没说怎么样去获得更好的睡眠,也没能因地制宜地帮你从锻炼中进行调理。

在新的一年,可穿戴设备需要针对这样的局限进行改进,切实地告诉大家如何才能有效地提高生活质量。这需要有带情境、可操作且精准的数据作为前提来对我们的日程行为进行调整。

情境数据
情境数据会将时间定位到一天的某个时刻后呈现给你。这不仅可以帮助你从杂乱的数据中进行快速筛选,还能让你对自己在一段时间内的状况有更好的认识。

如果数据杂乱且没有正确的情境,接触太多这样的数据就不一定有用了。就拿记录睡眠来说,我们要从睡眠数据中得到更多的信息,就需要知道白天以及就寝前哪些时候需要调整,还需要从周围环境得到一些其他数据来协助验证影响睡眠的方式及原因。

比如说,我们睡觉的时候,有一个连接到可穿戴设备的温度调节器来显示室内温度的变化。这种变化要附带睡眠模式,这样才可以帮助我们定量了解室温对睡眠质量的影响。

由于这些设备变得更加个性化,关联更紧密,因此我们所得到的数据关联性也会更强。如果设备能够将数据情境化,这样就会让我们容易知道如何改善周围的环境,采取恰当的行动。最终手机或者可穿戴设备就能根据这些情境信息以我们的喜好来调节环境。

可操作的数据
没有接下来要说的可操作的数据,情境数据就孤掌难鸣。不要再看我们睡了几小时,失眠了几小时,可操作数据会告诉我们如何让睡眠质量更好。这样做的高明之处在于我们可以看到实时的调整建议。比如可以监视温度调节器,然后根据我们睡眠模式的变化和夜间时间来调节温度。

早期可操作数据的例子就是Jawbone的某款产品,该产品可以根据室内的温度和湿度来提高或降低风扇的转速。

在2015年,消费者需要更多这样的产品,能够通过科技将用户体验与真正的价值相结合给生活带来便捷的产品。企业应该以满足消费者的期待来求得生存。

Whistle是一款宠物狗行踪追踪器。它能帮助宠物医生了解宠物的活动量。这样就可以给宠物的主人提供有益于改善宠物健康的建议。就像HealthKit移动应用平台那样,开发人员可以开发类似的功能,把数据信息传送给医生,医生可以给出可操作的建议,提高我们的生活质量。然而,所有这些功能都需要在精准的设备上工作。

精准程度
可穿戴设备目前并没有那么精准。很多用户都有这样的经历,所测量的步数和心率的变化很诡异,心率的变化好像一会儿心脏停跳了,一会儿又像刚跑完马拉松似的。设备制造商也意识到了这样的问题,他们正努力改进硬件以提高设备的精准度。

美国苹果公司声称,其推出的Apple Watch会像医院里大多数医疗设备那样精准,忠实地去记录使用者的心率。如果这些可穿戴设备像制造商承诺的那样精准,那就真的会使我们的生活更美好。

随着家电设备互联业界和可穿戴设备市场都揣摩着如何融入我们生活的方方面面,我们将会看到两者更多的合作,也会有更多的开发者开放平台出现。这会使设备间可以互相对话,一起工作。奠定这样的基础是下一个情境数据为王计算时代的一部分,而以单纯的数量作为度量标准的做法则会成为过去式。随着企业为消费者提供的用户体验更加个性化,大数据技术也将退居二线。