• Welcome to LiuJason's Blog!

标签:R语言

在R中使用API将地名转换为经纬度坐标

最近在分析全球癌症发病率与特定地理位置直接的关系,用到了CI5数据集。但是这个数据集中只有癌症登记机构的地名信息,而进行分析的话需要用到坐标,因此需要将地名转换为经纬度坐标。这里我找到了一个非常棒的API,只要注册账号即可免费转换,每天限制1500条:注册地址:【已隐藏】注册后在账户中可以看到API Key,在每次curl请求的时候附上这个key即可。……

使用R进行多线程multithreading数据处理

最近拿到了SEER的癌症发病数据,准备做一些流行病学的分析。但是SEER提供的数据是经过编码的,如果不使用他们定制的分析软件就只能先自己转码后再进行分析。我还是更喜欢用R一些,所以果断选择后者。这套数据编码后能压缩掉不少空间,但是要分析的时候也挺麻烦的,由于是根据position来确定变量数值,因此解码就是把这些变量按position和length信息……

CentOS下手动编译安装指定版本的R|最新版本3.6.0

碰到一个客户必须要R3.6….然后没辙,只好给他装一个。顺便记录一下如何安装指定版本的R,要替换其他版本只需要代码中的3.6.0改掉就行了。<code><span class="pln">yum groupinstall "Development Tools" -yyum i……

在Rstudio服务器上远程离线下载大文件

假如你有一个大数据库需要上传到服务器中进行分析,同时这个文件也是您从网上下载下来的,那么远程下载是最好的选择,不仅省去了中间环节,而且服务器100M每秒的大带宽会让你10秒内下载完1G的文件(理论最高速)。远程下载原理:你在服务器控制界面提交下载请求,服务器根据请求直接从网上下载文件。省去了你自己从源网站下载再上传到服务器的中间环节。操作步骤:1. 进……

CentOS7下安装所有的R包|Install all R packages in CentOS7

为了做R语言云计算服务,需要给服务器安装所有的R包,这样一来用户就不用担心安装和编译各种包的时候出现问题了。打个小广告:一个月仅15元的R语言云计算服务首先更新系统:yum update -y添加jag repovi /etc/yum.repos.d/jags.repo#写入[home_cornell_vrdc]name=Sundry pac……

R语言中分类变量(factor)、水平(level)的修改与转换

变量可归结为类别(名义型),有序型,连续型变量(区间变量)。类别变量和有序类别(有序型)变量在R中称为因子(factor)。区间变量取连续的数值,可以进行求和、平均等运算。名义变量和有序变量取离散值,可以用数值代表也可以 是字符型值,其具体数值没有加减乘除的意义,不能用来计算而只能用来分类或者计数。名 义变量比如性别、省份、职业,有序变量比如班级名次。函数f……

CentOS7安装最新版本gsl库|GNU Scientific Library|R语言依赖库

更新,直接安装包到lib64下不行,实际上gsl在安装的时候会默认把各种lib装到不同的地方,所有在下面第4去掉,然后第5步直接把路径改为/usr即可:5(新). ./configure –prefix=/usr————在安装R中的gsl包之前,我们需要在系统中安装gsl库。然而!R中的gs……

R语言安装所有扩展包 Install All Packages in CRAN

方案1:获取已安装列表,把CRAN上的包去掉列表然后全部安装# get names of installed packagespacks <- installed.packages()exc <- names(packs[,'Package'])# get available package namesav <- nam……

[已解决]CentOS7下R无法安装devtools和dplyr包的问题

有些最小安装的CentOS(比如坑爹的腾讯云)是不包括一些需要的依赖包的,所以:yum install -y openssl-devel libcurl-devel postgresql-devel……

[已解决]R 语言ggplot2在MacOS X 下作图中文字符显示乱码问题

是因为系统字体的原因,ggplot2默认字体是不带中文的,因此需要指定带有中文的字体库,这里用了别人找好的字体库名:theme(text = element_text(family = “STHeiti”))加上上面的参数就可以正常显示了……