当前在线人数15265
首页 - 分类讨论区 - 电脑网络 - 葵花宝典版 - 同主题阅读文章
未名交友
[更多]
[更多]
Python和R之争,看咱行动派做了啥
[版面:葵花宝典][首篇作者:njucct] , 2017年08月14日10:38:50 ,6893次阅读,67次回复
来APP回复,赚取更多伪币 关注本站公众号:
[首页] [上页][下页][末页] [分页:1 2 3 4 ]
njucct
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 1 ]

发信人: njucct (njucct), 信区: Programming
标  题: Python和R之争,看咱行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 10:38:50 2017, 美东)

三天前发的帖子,不过想到工作生活要分开,就注册了个小号来重发这个帖子,具体本
号是啥大家就不要追究了。

好久没上mitbbs,看到还有一堆人在吵Python和R的问题。以前我也说过,我喜欢
Python,但搞bioinformatics不用R基本不可能,所以经常被R搞一搞。大部分人可能就
认了,认真学习R,认真填坑,老夫是行动派,就搞了这个 http://vatlab.github.io/sos/ 。

这个 SoS是啥呢,名字叫做Script of Scripts ,就是包含其它语言的语言。具体
来说你可以用Python收集数据,搞个Pandas  DataFrame,然后用%put, %get啥把数据
转到R(或者SAS,或者Matlab等等)去分析,画图,分析完了如果需要用别的语言干啥
事,再接着转就行了,所有的东西都在一个Notebook里,比搞一堆scripts方便。就是
说你喜欢Python就用Python,喜欢R就用R,喜欢一起用就一起用,再也不用抱怨了。

SoS还在beta,但基本使用应该没问题,包含的东西比我以上说的东西多很多,特别是
在远程执行上有些特色。有兴趣的,或者说和我一样用多语言分析数据的不妨一试。有
啥意见建议直接上Github上说一声,多谢了。


--
※ 修改:·njucct 於 Aug 14 23:23:56 2017 修改本文·[FROM: 73.]
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 143.]

 
dracodoc
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 2 ]

发信人: dracodoc (david), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 11:21:32 2017, 美东)

争程序语言是很无聊的,该用什么用什么就是了,ploygot是对的。以前看到过你这个
,不过我现在还没有太多用python的需求。每个语言都有很多内容,能精通一个还是精
通一个比较好。当然需要的时候就上最合适的。

从另一方面来说,我现在比较倾向于能functional的就functional,python支持还是差
一点。

之前的争论是低级错误太多实在看不下去。
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 129.]

 
dracodoc
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 3 ]

发信人: dracodoc (david), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 11:22:23 2017, 美东)

另外rstudio的rmarkdown里也可以有python chunk,可能有点类似你这个的意思,将来
也许也会这么发展。

rmarkdown比jupyter nobtebook有很多优势,最主要的是能进version control。用惯
了rstudio,去用jupyter觉得各种土。
--
※ 修改:·dracodoc 於 Aug 14 11:23:16 2017 修改本文·[FROM: 129.]
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 129.]

 
njucct
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 4 ]

发信人: njucct (njucct), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 12:05:23 2017, 美东)

RStudio 现在在搞RStudio Notebook,但对其它语言支持还很差,基本只能执行完整的
小段的程序,语言间的数据交流和协同也基本没有。SoS的各个Kernel是同时运行的,
就是说一个语言执行过程中可以用其它语言完成某项工作,得到结果然后继续运行。而
被调用的因为是一个live session,所以不需要是完整独立的程序。



--
※ 修改:·njucct 於 Aug 14 12:12:14 2017 修改本文·[FROM: 143.]
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 143.]

 
njucct
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 5 ]

发信人: njucct (njucct), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 12:21:27 2017, 美东)

和SoS比较相像的是Beaker Notebook,但Beaker一直在alpha,以前试用的时候一堆问
题,不知现在好些没有。除了RStudio Notebook,还有个高大上的Apache Zeppelin不
知有人用过没有。SoS其实有两部分,SoS Notebook和Beaker Notebook接近,另外一部
分SoS Workflow Engine则是和Galaxy, CWL,Snakemake, Nextflow之类比较的。SoS的
长处在于把两者有机的结合在一起,打破了Interactive和batch运行之间的界限。
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 143.]

 
guvest
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 6 ]

发信人: guvest (我爱你老婆Anna), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 12:28:02 2017, 美东)

Org mode

或者excel 写写vba,想调用什么都可以


【 在 njucct(njucct) 的大作中提到: 】
<br>: 和SoS比较相像的是Beaker Notebook,但Beaker一直在alpha,以前试用的时候
一堆问
<br>: 题,不知现在好些没有。除了RStudio Notebook,还有个高大上的Apache
Zeppelin不
<br>: 知有人用过没有。SoS其实有两部分,SoS Notebook和Beaker Notebook接近,另
外一部
<br>: 分SoS Workflow Engine则是和Galaxy, CWL,Snakemake, Nextflow之类比较的
。SoS的
<br>: 长处在于把两者有机的结合在一起,打破了Interactive和batch运行之间的界限。
<br>
--
※ 来源:· 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2607:fb90:d9d:f]

 
njucct
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 7 ]

发信人: njucct (njucct), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 12:41:14 2017, 美东)

问题在于稍微复杂点的分析,就可能要用到别的语言的程序和库之类的。而且尽管
RStudio提供了一个基本什么都能做的环境,但很多方面实现的并不好(界面,交互,
并行运算等等),强行用R做所有的事情很多时候只是这个平台下无奈的选择而已。SoS
设计的目的就是用合适的语言和工具做合适的事情,不要去折腾什么Python版本的
ggplot,R版本的flot等等。

关于你另一个帖子的版本管理问题, SoS script (.sos) 很自然的可以用git,
subversion啥的来管理,SoS Notebook (.ipynb)可以选择commit整个notebook(价值
不大),或者转成一个纯文本格式,不包含程序输出的格式来管理(%sossave)。

【 在 dracodoc (david) 的大作中提到: 】
: 每个语言都有很多内容,能精通一个还是精
: 通一个比较好。当然需要的时候就上最合适的。



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 143.]

 
dracodoc
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 8 ]

发信人: dracodoc (david), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 12:46:31 2017, 美东)

是的,我说的就是rstudio notebook
我想主要问题是同时用多种语言的人并不多,大部分情况下也是分隔比较清晰的任务,
阶段性地用而不是需要更灵活的交替运行。
频繁切换语言大概对程序员的脑子是一种挑战。

【 在 njucct (njucct) 的大作中提到: 】
: RStudio 现在在搞RStudio Notebook,但对其它语言支持还很差,基本只能执行完整的
: 小段的程序,语言间的数据交流和协同也基本没有。SoS的各个Kernel是同时运行的,
: 就是说一个语言执行过程中可以用其它语言完成某项工作,得到结果然后继续运行。而
: 被调用的因为是一个live session,所以不需要是完整独立的程序。



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 129.]

 
njucct
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 9 ]

发信人: njucct (njucct), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 12:50:54 2017, 美东)

你这个还是局限在调用什么东西的阶段,和 R的system差不多。SoS首先在于解决了语
言间数据交换的问题,节省了把数据转出转入的麻烦;再一个是SoS的各个subkernel是
live的,你可以交互使用任何一个语言,方便调试运行;最后各个subkernel都可以自
己返回markdown或者HTML结果,产生一个完整的报告,方便使用。

【 在 guvest (我爱你老婆Anna) 的大作中提到: 】
: Org mode
: 或者excel 写写vba,想调用什么都可以
: <br>: 和SoS比较相像的是Beaker Notebook,但Beaker一直在alpha,以前试用的时候
: 一堆问
: <br>: 题,不知现在好些没有。除了RStudio Notebook,还有个高大上的Apache
: Zeppelin不
: <br>: 知有人用过没有。SoS其实有两部分,SoS Notebook和Beaker Notebook接近,另
: 外一部
: <br>: 分SoS Workflow Engine则是和Galaxy, CWL,Snakemake, Nextflow之类比较的
: 。SoS的
: ...................




--
※ 修改:·njucct 於 Aug 14 13:18:11 2017 修改本文·[FROM: 143.]
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 143.]

 
njucct
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 10 ]

发信人: njucct (njucct), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 12:56:48 2017, 美东)

我觉得同时用多种语言的人不多的原因就在于同时使用各种语言太麻烦。用一个最简
单的例子,如果我在Python中需要产生随机数,虽然Python有自己的module可以做这个
事情,但我脑子里最方便的还是rnorm,在SoS中就是

%with R -i n -o rn
rn = rnorm(n)

就是把Python中n传到R,在R中调用rnorm,然后把结果传回来。和Rstdio不一样的地方
还在于R是persistent的,下次我想知道rn的median,直接转到R,在R里面执行median(
rn);如
果想传结果到Python,用

%with R -o med
med = median(rn)

就可以了;如果在R那边已经算过了,在Python这边

%get med --from R

也行。

【 在 dracodoc (david) 的大作中提到: 】
: 是的,我说的就是rstudio notebook
: 我想主要问题是同时用多种语言的人并不多,大部分情况下也是分隔比较清晰的任务,
: 阶段性地用而不是需要更灵活的交替运行。
: 频繁切换语言大概对程序员的脑子是一种挑战。








--
※ 修改:·njucct 於 Aug 14 13:22:55 2017 修改本文·[FROM: 143.]
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 143.]

 
guvest
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 11 ]

发信人: guvest (我爱你老婆Anna), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 14:08:06 2017, 美东)

你查查我过去写的literate programming和多语言的一些帖子。

我只说一句:
多语言之间数据交换,在强壮性和坑少毛病少上,不管你什么办法,
很难赢clipboard+emacs/vim。

【 在 njucct (njucct) 的大作中提到: 】
: 你这个还是局限在调用什么东西的阶段,和 R的system差不多。SoS首先在于解决了语
: 言间数据交换的问题,节省了把数据转出转入的麻烦;再一个是SoS的各个subkernel是
: live的,你可以交互使用任何一个语言,方便调试运行;最后各个subkernel都可以自
: 己返回markdown或者HTML结果,产生一个完整的报告,方便使用。



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 192.]

 
guvest
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 12 ]

发信人: guvest (我爱你老婆Anna), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 14:13:56 2017, 美东)

org mode有啊
2http://orgmode.org/worg/org-contrib/babel/intro.html

R写的函数python的org mode段也可以调用

1http://orgmode.org/worg/org-contrib/babel/library-of-babel.html


【 在 njucct (njucct) 的大作中提到: 】
: 我觉得同时用多种语言的人不多的原因就在于同时使用各种语言太麻烦。用一个最简
: 单的例子,如果我在Python中需要产生随机数,虽然Python有自己的module可以做这个
: 事情,但我脑子里最方便的还是rnorm,在SoS中就是
: %with R -i n -o rn
: rn = rnorm(n)
: 就是把Python中n传到R,在R中调用rnorm,然后把结果传回来。和Rstdio不一样的地方
: 还在于R是persistent的,下次我想知道rn的median,直接转到R,在R里面执行
median(
: rn);如
: 果想传结果到Python,用
: %with R -o med
: ...................



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 192.]

 
njucct
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 13 ]

发信人: njucct (njucct), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 14:55:43 2017, 美东)

SoS 多语言支持相关的文档在 https://vatlab.github.io/SoS/doc/documentation/
Supported_Languages.html

大概看了一下org mode,抛开emacs和web interface 哪个方便不谈,我觉得这个数据
转换还是蛮有局限性的,主要是数据转换是capture result,只能传一个没有名字的结
果,而且以emacs/org为中介,可能没法转复杂(嵌套)类型或者大量数据。SoS概念上
不是传结果,是一个语言中的任何变量都可以随时传到任何其它语言。就拿返回table
的类型来说,SoS下R data.frame转到Python 成为DataFrame,转到Matlab成为table,
转到Octave成为dataframe,转到SAS成为dataset,转到JavaScript是nested
dictionary,都是native datatype,大量数据的传递会用disk file (诸如feather),
而且语言接口允许任何两个语言之间直接转数据,尽量不丢失信息。

【 在 guvest (我爱你老婆Anna) 的大作中提到: 】
: org mode有啊
: 2http://orgmode.org/worg/org-contrib/babel/intro.html
: R写的函数python的org mode段也可以调用
: 1http://orgmode.org/worg/org-contrib/babel/library-of-babel.html
: median(



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 143.]

 
dracodoc
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 14 ]

发信人: dracodoc (david), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 15:04:57 2017, 美东)

我只说一句

我不用emacs/vim,很多人也不用。

【 在 guvest (我爱你老婆Anna) 的大作中提到: 】
: 你查查我过去写的literate programming和多语言的一些帖子。
: 我只说一句:
: 多语言之间数据交换,在强壮性和坑少毛病少上,不管你什么办法,
: 很难赢clipboard+emacs/vim。



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 129.]

 
dracodoc
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 15 ]

发信人: dracodoc (david), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 15:16:15 2017, 美东)

bioinfo用你这个还是很有意义,太多太杂的工具,需要混合起来用。
其他人如果都自己写code,大部分人不会同时用几种语言。

你没有多做一点宣传?至少在hacker news上贴几次吧,github上star才17个,
marketing做的太不够了。


【 在 njucct (njucct) 的大作中提到: 】
: SoS 多语言支持相关的文档在 https://vatlab.github.io/SoS/doc/documentation/
: Supported_Languages.html
: 大概看了一下org mode,抛开emacs和web interface 哪个方便不谈,我觉得这个数据
: 转换还是蛮有局限性的,主要是数据转换是capture result,只能传一个没有名字的结
: 果,而且以emacs/org为中介,可能没法转复杂(嵌套)类型或者大量数据。SoS概念上
: 不是传结果,是一个语言中的任何变量都可以随时传到任何其它语言。就拿返回
table
: 的类型来说,SoS下R data.frame转到Python 成为DataFrame,转到Matlab成为table,
: 转到Octave成为dataframe,转到SAS成为dataset,转到JavaScript是nested
: dictionary,都是native datatype,大量数据的传递会用disk file (诸如feather),
: 而且语言接口允许任何两个语言之间直接转数据,尽量不丢失信息。



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 129.]

 
njucct
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 16 ]

发信人: njucct (njucct), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 16:23:47 2017, 美东)

怎么说呢,自家的孩子,再怎么喜欢,出门前还是要清理打扮一番,不要满身虫子。年
初好不容易出了个稳定版本,内部讲了一下,结果下面说我们干活要在cluster上运行
各种程序,你这个局限在本地机没啥意思。我想想也对,花了老大力气完善了远程执行
功能,年中在扩大化会议上又讲了一次。结果隔壁biostat的哥们说咱们干活就用R和
SAS,你这玩意不支持SAS我们不买账。我只有哼呦哼呦的加上SAS和Matlab,让他们闭
嘴。然后一号称搞Data Science的说咱那疙瘩用Julia,你行行好加上 Julia?我听了
只想哭。

不管怎么说,现在SoS算是基本完整了,但没被版上大牛批一批总觉得不踏实。所以大
家有什么意见尽管提,我一定虚心接受。如果你喜欢ruby啥的,可以直接要求,但我个
人实在是精力有限,如果你能搞个PR就再好不过了。

【 在 dracodoc (david) 的大作中提到: 】
: bioinfo用你这个还是很有意义,太多太杂的工具,需要混合起来用。
: 其他人如果都自己写code,大部分人不会同时用几种语言。
: 你没有多做一点宣传?至少在hacker news上贴几次吧,github上star才17个,
: marketing做的太不够了。
: table



--
※ 修改:·njucct 於 Aug 14 16:28:49 2017 修改本文·[FROM: 73.]
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 73.]

 
guvest
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 17 ]

发信人: guvest (我爱你老婆Anna), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 16:24:43 2017, 美东)

我是生产环境用多语言编程。给客户,以及往外面卖的代码。

你底下这段话牵涉的东西太多。代码维护难度太高。就算你现在没有坑。
MSFT改改net库未来可能就废了。我不可能考虑的。

我踩了无数坑之后的经验:
如果真的是生产环境需要多语言编程的话。工具只能是自己造,而且还要尽
量用简单强壮的结构设计。我主要就是用剪贴板。不用别的各程序之间共享
或者传递数据的复杂技术。


【 在 njucct (njucct) 的大作中提到: 】
: SoS 多语言支持相关的文档在 https://vatlab.github.io/SoS/doc/documentation/
: Supported_Languages.html
: 大概看了一下org mode,抛开emacs和web interface 哪个方便不谈,我觉得这个数据
: 转换还是蛮有局限性的,主要是数据转换是capture result,只能传一个没有名字的结
: 果,而且以emacs/org为中介,可能没法转复杂(嵌套)类型或者大量数据。SoS概念上
: 不是传结果,是一个语言中的任何变量都可以随时传到任何其它语言。就拿返回
table
: 的类型来说,SoS下R data.frame转到Python 成为DataFrame,转到Matlab成为table,
: 转到Octave成为dataframe,转到SAS成为dataset,转到JavaScript是nested
: dictionary,都是native datatype,大量数据的传递会用disk file (诸如feather),
: 而且语言接口允许任何两个语言之间直接转数据,尽量不丢失信息。



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 192.]

 
guvest
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 18 ]

发信人: guvest (我爱你老婆Anna), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 16:25:21 2017, 美东)

excel + 剪贴板, even better

【 在 dracodoc (david) 的大作中提到: 】
: 我只说一句
: 我不用emacs/vim,很多人也不用。



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 192.]

 
guvest
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 19 ]

发信人: guvest (我爱你老婆Anna), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 16:29:47 2017, 美东)

不同强壮性要求的软件实际上是非常不一样的。
我觉得你可能要先弄清楚自己的潜在客户是什麽,对软件强壮性要求多高。

光是julia,pandas,R,SAS,excel。。。的dataframe格式
的互相转换,你要弄出来没bug的一个互相转换的工具,就已经足够牛X了。
关键是质量高,不一定要大而全的。

【 在 njucct (njucct) 的大作中提到: 】
: 怎么说呢,自家的孩子,再怎么喜欢,出门前还是要清理打扮一番,不要满身虫子。年
: 初好不容易出了个稳定版本,内部讲了一下,结果下面说我们干活要在cluster上运行
: 各种程序,你这个局限在本地机没啥意思。我想想也对,花了老大力气完善了远程执行
: 功能,年中在扩大化会议上又讲了一次。结果隔壁biostat的哥们说咱们干活就用R和
: SAS,你这玩意不支持SAS我们不买账。我只有哼呦哼呦的加上SAS和Matlab,让他们闭
: 嘴,结果一号称搞Data Science的说咱那疙瘩用Julia,你行行好加上 Julia?我听了
: 只想哭。
: 不管怎么说,现在SoS算是基本完整了,但没被版上大牛批一批总觉得不踏实。所以大
: 家有什么意见尽管提,我一定虚心接受。如果你喜欢ruby啥的,可以直接要求,但我个
: 人实在是精力有限,如果你能搞个PR就再好不过了。




--
※ 修改:·guvest 於 Aug 14 16:30:48 2017 修改本文·[FROM: 192.]
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 192.]

 
njucct
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 20 ]

发信人: njucct (njucct), 信区: Programming
标  题: Re: Python和R之争,看看行动派做了啥
发信站: BBS 未名空间站 (Mon Aug 14 16:42:28 2017, 美东)

这个意见我虚心接受,但我们搞bioinformatics的和你们不一样。各种工具层出不穷,
还天天升级,你用一个语言写得再好的workflow,过两天人家一升级就废了。被长期虐
待之下,我们习惯于写各种script,fix各种问题,而这个时候workflow的清晰性,可
重复性,易修改性就特别重要了。SoS的workflow基本原封不动的包括各种script,在
可维护性这个方面比起“正规”的workflow系统还是有优势的。

【 在 guvest (我爱你老婆Anna) 的大作中提到: 】
: 我是生产环境用多语言编程。给客户,以及往外面卖的代码。
: 你底下这段话牵涉的东西太多。代码维护难度太高。就算你现在没有坑。
: MSFT改改net库未来可能就废了。我不可能考虑的。
: 我踩了无数坑之后的经验:
: 如果真的是生产环境需要多语言编程的话。工具只能是自己造,而且还要尽
: 量用简单强壮的结构设计。我主要就是用剪贴板。不用别的各程序之间共享
: 或者传递数据的复杂技术。
: table



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 73.]

[首页] [上页][下页][末页] [分页:1 2 3 4 ]
[快速返回] [ 进入葵花宝典讨论区] [返回顶部]
回复文章
标题:
内 容:

未名交友
将您的链接放在这儿

友情链接


 

Site Map - Contact Us - Terms and Conditions - Privacy Policy

版权所有,未名空间(mitbbs.com),since 1996