写代码的人

Posts tagged ‘开源’

机器人开源平台 TurtleBot

Willow Garage是美国一个由多位机器人专家在2006年建立的公司,致力于机器人硬件和开源软件的研发。最近,他们推出了一个名为TurtleBot的机器人开源平台。

设计TurtleBot的目的是给入门级的机器人爱好者提供一个基础开发平台,让他们直接使用TurtleBot自带的软硬件,专注于应用程序的开 发。我们知道,从头开始做一个机器人,需要设计草图,购买、加工材料、设计电路、编写程序、组装等一系列工作。借助开源机器人平台,可以节省很多前期工 作,只要根据平台的软硬件接口,就能开发出所需的功能。一个好的机器人平台,能够满足很多开发要求,但一定程度上也限制了开发空间,这都取决于平台本身的 软硬件系统。

TurtleBot的硬件主要有iRobot Create控制板、Kinect传感器、华硕1215N双核笔记本、3000mAh电池和可装卸的结构模块;使用著名的ROS(Robot Operating System )作为操作系统,能实现3D地图导航、跟随等功能。

TurtleBot虽然有如此高性能的软硬件配置,但售价不贵。最基本的配置售价是500美元,包括:

  • USB Communications Cable
  • TurtleBot Power and Sensor Board
  • TurtleBot Hardware
  • Microsoft Kinect
  • TurtleBot to Kinect Power Cable
  • USB Stick TurtleBot Installer

全套配置是1200美元,包括:

  • iRobot Create Robot
  • 3000 mAh Ni-MH Battery
  • Fast Charger
  • Asus EeePc 1215N

其中iRobot Create约$200,华硕笔记本约$500。所以说整套配置的性价比还是不错的。重要的是,TurtleBot可以节省很多开发时间,还提供了强大的 3D导航等基本功能。想想看,你要开发一个具有这些功能的机器人,需要多少成本和时间,需要攻克多少技术难题。

本文转载自: http://www.robotain.com/

 

Advertisements

开源云计算:Yahoo的创新驱动力

经常有人问,Yahoo准备转向云吗?我们的回答是,不,我们已经是云了。 Yahoo不会提供Amazon或者 Google那样的公共云平台。但是,我们早就开始向数以亿计的用户提供个人云服务了:邮 箱、照片、金融服务等等。我们称之为个人云。

更重要的是 ,当业界目前更多地将云计算视为降低成本、节约能源手段的时候(这些当然也非常重要),在Yahoo,云计算已经成为一种关键性的创新驱动力。

作为全球最大的互联网公司之一,Yahoo正面临着巨大的技术挑战。公司自身拥有庞大的网络资产,超过9千万网页,6亿用户(仅Yahoo邮件就有超过3亿的用户),成百个关注点和背景各异的产品和服务,每天要通过分析一千 亿以上各种各样的事件:登录、提醒、广告点击、文章点击、论坛发贴、上传图片、打标签、购物车……每天的流量数据以PB计算,存储数据量更是以数百PB的速度增加 ……

怎样才能在如此大规模的平台上,快速从海量数据中提取有价值的信息,将最受欢迎的内容提供给对其最感兴趣的用户,满足各种各样个性化的使用模式?怎样在这种规模的平台上,将停运时间降至最低(在Yahoo,即使是短时的停运,损失都将高达数百万美元),满足用户不断变化的需求,提供更好的用户体验?怎样优化Yahoo的 现有产品与服务,提升广告商的满意度,从而提高公司的 收益?

应对这些挑战只能依靠创新,而创新又有赖于云计算 基础设施的支持。与其他公司不同的是,Yahoo在云计算方面采取了全面开源的战略。众所周知,Yahoo是开源云计算技术平台Hadoop的诞生地和主要支持力量。在过去 五年多时间里,Yahoo在Hadoop以及Pig、ZooKeeper、Hive、Howl、HBase和Oozie等相关开源项目中投入了大 约300人年,累计数千万美元,将Hadoop从一个有趣的原型发展为坚实的可扩展框架,产生了丰硕的成果。

Hadoop也已经成为Yahoo基础设施和许多重要业务流程(搜索、广告、反垃圾邮件、个性化等等)的核心组件。Hadoop在Yahoo内部已经广泛应用于多个生产环境, 涉及全球多个数据中心,超过4万台服务器(内含30万以上 的CPU核心),20多个集群。其中最大的集群包括4千台服务器,也是世界上规模最大的Hadoop集群。目前Hadoop支持着公司内部1000多个科研团队用户,每天超过20万个作业,每秒几万次请求。甚至可以说,在Yahoo各个网站上每一次点击背后都有Hadoop的功劳。Hadoop使Yahoo更多研发人员可以在更高的抽象层次工作,大大缩短了产品开发 周期,显著减少了人力和基础设施成本。

未来,Yahoo还将对Hadoop等云计算基础设施研发和社区支持继续投入。而且,我们正计划通过Hadoop和其他开源项目,将Yahoo内部所有的底层云计算基础架构逐步地全部开源。为什么我们这样大力支持开源?原因很简单,我们不认为这些云计算基础技术是什么差异化竞争优势,而且Yahoo已经从Hadoop活跃的开源社区中获益匪浅。

从Hadoop的成功故事中,我们可以总结以下几点开源的优势:

通过开源,Hadoop已经从一个内部技术成长为优秀而稳定的工业标准,从而避免了一般企业内专有技术经常遇到的被外部新标准逼向死胡同的问题。

通过开源,Hadoop社区在Yahoo之外出现了更多活跃用户,他们的贡献产生了许多对Yahoo也很重要的技术,比如HBase和Hive,最终节约了公司的成本。

通过开源,Yahoo公司能够从社区更容易地聘请到优秀的训练有素的人才,而且与许多伙伴的合作也更加顺畅。

更重要的是,通过开源,我们既能够以最经济高效地方式进行研发,实现自身的业务目标,又能够欣喜地看到自己的工作被成千上万的人用于远超出预期的各行各业,最终改变了世界,我们为此而深感自豪。

 

SourceForge开源其平台软件 —— Allura

SourceForge在Apache许可证下发布了其平台软件Allura,允许开发者创建自己的开源平台。

SourceForge的开发者将在博客上介绍Allura平台中Python、MongoDB、Solr和RabbitMQ的使用。此前SourceForge曾经公开过它的平台软件,但后来又改为闭源了,结果社区创建了一个分支 GForge

SourceForge.net,全球最大的开源项目和代码托管网站。开源软件下载次数累计已经超过40亿人次。

自从1999年,SourceForge提供开源下载业务,并一直处理领导地位,虽然近几年Google Code带来了一些挑战。SourceForge现在有23万个开源项目,230万注册用户,每天的下载次数大约180万

 

海量数据:开源工具VS专有工具 你选谁?

这是个信息“泛滥”的时代,大数据量司空见惯,企业处理大数据的需求也越来越大。本文梳理一下“大数据”的解决方案。

首先,关系型数据库和桌面分析或者虚拟化包不能处理大数据,相反,运行在数千台服务器上的大量并行软件需要做这个工作。

许多机构转向开源工具,比如Apache的 Hadoop来处理大数据。比如Twitter发送登陆信息到Hadoop,并直接写入HDFS,Hadoop文件系统。

Hadoop支持数据密集的应用部署在数千节点和数个PB, David Hill, Mesabi Group 主席表示。

但是,大数据在针对不同类型的应用时,确不能一概而论。比如Hadoop并不一定适合所有的案例,Hill警告说。

大数据的捕捉、存储、分析,依靠特殊的应用的特性,Hill强调。举例scale-out网络连接的存储EMC Isilon或IBM的SONAS,可能对于使用非结构化的数据比如图片、视频,会更好。

大数据处理的类型

大数据的处理,可以归为3个基本类型,Revolution Analytics的执行副总Mike Minelli表示,信息管理、商业智能,以及智能分析。

信息管理捕捉和存储信息,BI分析数据,看过去发生的情况,智能分析则是对于数据的预测。Minelli说。

Revolution analytics提供开源R语言和 Revolution R Enterprise,提供TB量级数据的高级分析。Revolution Analytics正在开发Hadoop连接器和R语言在Google的Map/Reduce框架上的能力。

处理大数据的工具

提供了处理大数据分析能力的专有软件包括 AsterData;IBM的专有软件Netezza ; Datameer, 建立在Apache的Hadoop上的专有软件,以及Paraccel。

IBM的Netezza,在它的InfoSphere产品中。Oracle 的Exadata,,以及EMC的Greenplum也是处理大数据量的专有工具。

EMC引入了Greenplum数据库的免费社区版本,该社区版本只是软件。Greenplum社区报表包括3个协作模块Greenplum DB, MADlib, 和Alpine Miner。

处理大数据量的开源工具包括Hadoop、Map/Reduce,以及Jaspersoft 的BI工具。

Jaspersoft提供的BI工具,提供了报告、分析、ETLETL (解压、转换、加载) ,针对大量的并行分析数据库,包括EMC Greenplum和HP Vertica。Jaspersoft也提供本地报告,通过Hadoop和各种类型的NoSQL数据库包括MongoDB, Riak, CouchDB and Infinispan的开源连接。

开源工具VS专有工具

开源工具可以查看代码,这样开发者可以找到他们整合时里面是什么。在几乎所有的案例中,开源分析都更具性价比和灵活性。Revolution Analytics的Minelli表示。

数据量在持续的增长,公司将被迫增加基础设施的部署。专利费用将一直增加,而开源技术,则省了这笔一直持续的专利费。Twitter选择Hadoop,其中重要的原因是专有工具的费用太高。

更长远的来看,开源工具使企业创建新的分析技术,更好的处理非结构化的语言,比如图片等。而不能寄托于传统厂商发展新的分析技术。开源工具给了企业创新的机会。

另外一个领域就是开源与专有工具的混合使用。

短期来讲,开源分析将越来越广泛的使用,并且增长迅速。长期来看,混合技术的应用将在高度竞争的市场上出现,两者将同样有巨大的需求。

译文链接:http://www.oschina.net/news/15856/Big-Data-Big-Open-Source-Tools

 

IDC评测:六大开源搜索引擎工具

搜索引擎会为用户根据一定的策略、运用特定的计算机程序在互联网海量的信息中进行搜集。对信息进行组织和处理之后,提供检索服务,为用户展示相关的信息。而企业网站上的相关信息要浏览者获得好感,站点上的搜索同样不容忽视。下面,IDC评述网与大家分享6个搜索引擎工具。

1. PhpDig
PhpDig是一个采用PHP开发的Web爬虫和搜索引擎。通过对动态和静态页面进行索引建立一个词汇表。当搜索查询时,它将按一定的排序规则显示包含关键字的搜索结果页面。适用于专业化强、层次深的个性化搜索引擎。

2. Sphider
Sphider是一个轻量级,采用PHP开发的web spider和搜索引擎,使用mysql来存储数据。可以利用它来为自己的网站添加搜索功能。Sphider非常小,易于安装和修改,已经有数千网站在使用它。
3. Sphinx
Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL、PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。

4. OpenWebSpider
OpenWebSpider是一个PHP开源多线程WebSpider(crawler:爬虫,robot:机器人)和包含许多有趣功能的搜索引擎。目前OpenWebSpider还提供MP3和PDF文件支持,以及增强编码支持等功能。

5. RiSearch PHP
RiSearch PHP是一个高效,功能强大的搜索引擎,特别适用于中小型网站。它检索非常快,能够在不到1秒钟内搜索5000-10000个页面。它能帮用户网站做索引并建立一个数据库来存储网站上所有页面的关键词以便快速搜索。

6.ASPSeek
ASPSeek是一个C++编写的免费开源互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序。

来自:http://www.oschina.net/news/15863/6-opensource-search-engines

 

20个开源项目托管站点推荐

托管站点Top20如下:

1. SourceForge

SF为大家所熟知,开源项目的大本营,SF托管至少28万个开源项目,一天的下载量超过200万。

2. GitHub

GitHub托管使用Git版本控制系统的公开和私有项目。 目前该网站托管超过170万存储项目,包括许多开源软件。

3. Google Code

Google提供免费的使用Subversion或是Mercurial版本控制系统的开源项目托管服务。 它提供2G的存储空间,整合了代码查看工具、wiki、问题跟踪。Google Code站点也提供了大量的Googe自己的APIs和其他开发工具。

4. Eclipse Labs

同样由Google Code托管, Eclipse Labs 是建立在Ecipse平台上的开源项目存储。提示,这些并不是官方的Eclipse基金会项目。

5. BitBucket

类似GitHub, BitBucket托管公开和私有项目。在这个站点上,开源项目和私有项目的用户少于5人,则免费。它托管了超过4.8万个项目,多数可在站点上搜索。

6. LaunchPad

由Ubuntu的东家Canonical维护,LaunchPad目标是运行在Ubuntu上的项目。它托管超过2.1万个使用Bazaar版本控制系统的项目。

7. Codehaus

Codehaus定义自己为“开源软件的协作开发环境”。托管需要审查,是否符合站点的声明。

8. RubyForge

从名字您就可猜出,它托管Ruby程序语言开发的开源项目,目前托管项目超过9000个。

9. Tigris

Tigris具有很强的专注性,仅限于“为协作软件开发创建更好的工具”。它目前包括700个项目。

10. BerliOS Developer

BerliOS Developer为各种类型的开源项目提供免费的托管服务,并且支持的语言众多。目前它托管的项目超过4600个。

11. Savannah—GNU

Savannah定义自己为“官方GNU软件的开发、维护、发行的中心”。它托管410个官方GNU项目。

12. Savannah—non-GNU

与Savannah-GNU相对应,Savannah-non-GNU托管其他类型的开源项目,总是超过2800个。

13. Gna!

如果你访问过Savannah项目,Gna!会非常类似,因为它使用同样的软件,并同样关注GNU相关的项目。目前它托管1350个项目。

14. CodePlex

由微软托管,Codepex提供微软开发的开源软件和一些社区项目。它提供下载的项目超过2万。

15. Java.net

最早由Sun公司创立,Java.net托管和链接大量的Java相关的项目。另外,它也包括许多的博客、论坛和其他Java社区资源。

16. Gitorious

Gitorious提供使用Git版本控制系统的开源项目免费的托管服务。它托管了一些著名的软件,包括OpenSUSE、Qt相关项目。

17. TuxFamily

TuxFamily为开源软件提供免费托管服务,托管数量超过2300。提示,这是一个法语组织。

18. KnowlegeForge

KnowlegeForge规模较小,托管250个项目。它由Open Knowledge基金会支持,使用多种版本控制系统。

19. OSOR

OSOR是欧盟站点,目前托管200个开源项目,链接项目超过2500个。该站点包含自由和开源软件的相关搜索和新闻。

20. OW2

OW2(the ObjectWeb Forge)提供基础软件相关的开源项目托管服务,目前托管188个项目。

来自:http://www.oschina.net/news/15806/20-opensource-host-websites

陆首群:开源中间件的主流优势

下面是陆首群在2009Apache亚洲路演北京站会议上的讲话:

我很荣幸应邀参加Apache亚洲路演的北京站活动。

Apache是一支优秀的开源团队(600个正式代码维护者、广大志愿开发者),具有先进的开发机制(开源社区、Help或孵化器、Top开发项目和开发环境), 并做出了辉煌的业绩。你们开发的开源中间件(软件):Apache、Tomcat,配置Web服务器、应用服务器(硬件),在广域网(含互联网)中使用, 由于质量稳定、可靠性高、灵活性大、可扩展性好、成本低等特点,自1995年以来,长期保持主流地位和竞争优势,为开源软件争来了光荣,这是很不容易的。 我看了你们送来的资料,以最近(2009年11月份)的统计为例,配置开源Apache的Web服务器在网络市场的份额为47%,微软IIS服务器为 17%。去年你们在北京召开Apache峰会时,我曾表示过担心:Apache和IIS两条市场份额曲线之间的间隔是否会缩小(即竞争优势是否会丧失), 过了一年从现在来看,Apache的曲线基本稳定,IIS的曲线大幅下降(降幅达38%),微软似乎出现了危机!

众所周知,由于开源软件 LAMP架构(L-Linux操作系统,A-Apache开源中间件,M-MySQL开源数据库,P-PHP、Perl、Python、Ruby超文本语 言)的崛起,与IBM、SUN主导的J2EE架构(Java语言)和微软主导的.Net架构(C#语言)形成了三角鼎立的竞争架势(过去我主张用户也可根 据自己需要,同时采用混源架构,这时就形成了既有竞争又有合作的架势)。LAMP也是一种信息化应用的解决方案,Apache的强势表现增强了LAMP的 优势。不久前,美国政府采用开源代码改造白宫网站,并运行在LAMP平台上,他们如此做的原因据说是考虑LAMP安全、快速、灵活,并不依赖于某个私有厂 商的诸多特点。

下面我简要地向各位介绍整个开源软件的一些发展背景:

(1)Linux操作系统

2008年全球 各种服务器操作系统的市场份额为:Linux 25%,Windows 64%,Unix 11%;中国:Linux12%,Windows 48%就,Unix40%。在服务器、互联网、移动嵌入式、高性能计算、云计算等领域,Linux已成为主流;智能手机的Linux化和时尚潮流化已成为 其发展趋势。

我过去一直讲桌面Linux是Linux发展的软肋,今年是Linux桌面年,桌面Linux正在起飞(进行时);必 须指出国外一些市场调研公司,通常以Web终端的数据代替桌面终端的数据,误导公众,还是微软CEOSteve Ballmer说了大实话,他说:根据微软自己的调研,Linux在商用和家用PCs中所占的份额和苹果的MacOS-X相似,这就是说目前桌 面Linux的市场份额不是1-2%而是5%左右。顺便说一句:上网本有力地支持了Linux的发展,年初美国NPDGroup市场调研公司也来一次误 导,说现在90%的上网本都装Windows XP,NPD的错误有三:①它也是按其Web站点作的调查,② 仅在美国市场调查,③只调查了2008年11月和2009年1月。据ABI对2009年全球3500万款上网本的调查来看,68%装 Windows,32%装Linux。

(2)Apache开源中间件

Apache的市场份额已如前述,下面补充介绍Apache在中国普及的情况。

据 www.mexen.net统计,2005年在中国,Apache占 本国采用的Web服务器市场的17.65%(居全球国别统计倒数第二),2007年9 月Apache占有率提升到24.22%,2008年又提升到30%左右。金蝶开发的开源中间件已达量产和应用阶段。开源中间件具有主流优势,现在是如何 做的更大、更强的问题。

(3)Firefox开源浏览器

Firefox在全球增长很快,今年10月统计,市场份额达24%(微软的IE为64.7%),国内市场份额约5-6%。为挖掘提升Firefox 国内市场潜力,需要解决一些技术和政策措施。

(4)MySQL开源数据库

近几年MySQL在国内市场发展很快。MySQL(社区版)2006年全国下载量为1.1亿套,中国为250万套,占全球的 2.3%;MySQL(商业版)国内年销量约2000套,占全球的2.5%。PostgreSQL开源数据库在国内也有广泛应用。

(5)办公套件

2008年国内办公套件销售80万套,1.2亿元(与2007年大致持平),具有一定规模;另外,2008年国内免费下载 OpenOffice.org 230万套,占全球下载量2.3%。

(6)PHP、Perl、Python、Ruby超文本编程语言

2007 年,PHP在中国市场的份额为23.17%,在全球国别排序中居中,甚至高于美国(21.27%)、英国(17.93%)、日本 (10.56%),Perl、Python在国内也有广泛应用;最近才推出的Ruby,其创始人松本于今年5月来上海交流,目前国内也有应用。

Apache 基金会主席Justin Erenkrantz说,Apache第2版的许可证ALv2即GPLv3(ALv2 isGPLv3),GPL项目可用它(Apache),但GPL不含在Apache中(Can be used by GPL Projectsbut no GPL within Apache),Apache不执行左版(CopyLeft)。如此说来,Apache应该是开源软件而不是自由软件。我认为,自由软件与开源软件均 不排斥商业模式,而商业模式是把开源软件做大做强的前提,在当前,为开源软件探索其商业模式已蔚然成风。为此,我向JustinErenkrantz先生 建议:为了Apache更大发展,Apache需要探索自己的商业模式,Erenkrantz对我说:Apache做的完全是公益事业,不谋求像赢 利这样的商业行为,Apache的核心人员,包括我在内都是不支付工资的,我说:正像你们指出那样,Apache一路走来:Geek、Need、 Interest、Career、Work、Givingback、Help、Challenge,现在要迎接挑战,与时俱进。软件可以免费,但与软 件捆绑在一起的硬件或服务、维护、授权,或网络运营,或内容、广告等原来就是收费的,如果Apache能同时在其中也付出价值,找到价值点,我想可考虑从 中提成。作为开源软件的Apache如果能找到自己的商业模式,将如虎添翼,可以做的更大更强。这个建议将提供Apache基金会作研究。