• Welcome to LiuJason's Blog!

标签:统计

CentOS7下安装R ShinyServer并配置git和监听端口/IP

前言原本我是不想写的,但是考虑到后续自己可能还会用到,还是记录一下吧。安装过程很简单就是添加源、装依赖、拉包并安装。可以参考rstudio的安装方法:https://www.liujason.com/article/121.html这次是在CentOS7的LXC中进行安装,为了做这个东西:https://r-shiny.liujason.com/sea……

在R中使用API将地名转换为经纬度坐标

最近在分析全球癌症发病率与特定地理位置直接的关系,用到了CI5数据集。但是这个数据集中只有癌症登记机构的地名信息,而进行分析的话需要用到坐标,因此需要将地名转换为经纬度坐标。这里我找到了一个非常棒的API,只要注册账号即可免费转换,每天限制1500条:注册地址:【已隐藏】注册后在账户中可以看到API Key,在每次curl请求的时候附上这个key即可。……

使用R进行多线程multithreading数据处理

最近拿到了SEER的癌症发病数据,准备做一些流行病学的分析。但是SEER提供的数据是经过编码的,如果不使用他们定制的分析软件就只能先自己转码后再进行分析。我还是更喜欢用R一些,所以果断选择后者。这套数据编码后能压缩掉不少空间,但是要分析的时候也挺麻烦的,由于是根据position来确定变量数值,因此解码就是把这些变量按position和length信息……

在Rstudio服务器上远程离线下载大文件

假如你有一个大数据库需要上传到服务器中进行分析,同时这个文件也是您从网上下载下来的,那么远程下载是最好的选择,不仅省去了中间环节,而且服务器100M每秒的大带宽会让你10秒内下载完1G的文件(理论最高速)。远程下载原理:你在服务器控制界面提交下载请求,服务器根据请求直接从网上下载文件。省去了你自己从源网站下载再上传到服务器的中间环节。操作步骤:1. 进……

R语言中分类变量(factor)、水平(level)的修改与转换

变量可归结为类别(名义型),有序型,连续型变量(区间变量)。类别变量和有序类别(有序型)变量在R中称为因子(factor)。区间变量取连续的数值,可以进行求和、平均等运算。名义变量和有序变量取离散值,可以用数值代表也可以 是字符型值,其具体数值没有加减乘除的意义,不能用来计算而只能用来分类或者计数。名 义变量比如性别、省份、职业,有序变量比如班级名次。函数f……

CentOS7安装最新版本gsl库|GNU Scientific Library|R语言依赖库

更新,直接安装包到lib64下不行,实际上gsl在安装的时候会默认把各种lib装到不同的地方,所有在下面第4去掉,然后第5步直接把路径改为/usr即可:5(新). ./configure –prefix=/usr————在安装R中的gsl包之前,我们需要在系统中安装gsl库。然而!R中的gs……

R语言安装所有扩展包 Install All Packages in CRAN

方案1:获取已安装列表,把CRAN上的包去掉列表然后全部安装# get names of installed packagespacks <- installed.packages()exc <- names(packs[,'Package'])# get available package namesav <- nam……

[已解决]libudunits2.so was not found安装sf时报错|CentOS

安装sf的时候出现如下错误:checking udunits2.h usability… nochecking udunits2.h presence… nochecking for udunits2.h… nochecking udunits2/udunits2.h usability… noche……

[已解决]”proj_api.h presence and usability… no”安装proj-devel——R语言中GIS包rgdal的依赖包|CentOS7为例

首先看这里:https://www.liujason.com/article/152.html然后,ssh里安装gdal-devel, proj-devel, proj-nad, proj-epsglibgdal.so问题:cp /usr/local/lib/libgdal.so.20* /usr/lib64/libkmldom.so问题:wget……