0%

最近工作上接触到一些Covid-19新冠病毒一些信息,平时也常常看到国内外各个地区确诊患者不断的增加,但是还有一些我想了解的数据并没有在一些主流媒体上呈现出来;因此想通过自己的方式来可视化这些数据,依次解决以下问题:

  • 下载整理每天确诊/死亡/治愈的患者数据
  • 通过地图可视化方式来呈现各国各地区的最新患者数目
  • 使用常规图标来呈现各国患者的变化趋势
    Read more »

Co-mutation and exclusion analysis in R这篇文章中提到maftools包的somaticInteractions()函数可以做Co-mutation/exclusion分析及可视化

由于结果图中展示的颜色有点问题,因此我去查看了下其源码,发现其是参考文献:Combining gene mutation with gene expression data improves outcome prediction in myelodysplastic syndromes

Read more »

Confusion Matrix,及混淆矩阵,用于展示模型预测精度的一种较为常见的方法;其属于分类模型评价方法中的一种,其他还有收益图(Gain),提升图(Lift),ROC等

对于最常见的二元分类来说,它的混淆矩阵是2x2的,以wiki图为例:

Read more »

推荐三篇关于Shiny module使用技巧的博文,相比shiny官网中的module相关教程,其更加深入的介绍了一些用法(PS. 是一家名为ArData的公司写的,其有open source里有几个R包蛮有名的--officer包和flextable包):

Read more »

最近找shiny resource,发现shiny的shinyWidgets拓展包使用着非常不错,能给shiny各个控件润色不少,记录下一些有趣的功能

示例概览可以看官方文档:Widgets available

Function reference包含了shinyWidgets包所有的函数,点击后可查看具体某个函数的示例

为了方便后续的使用,我对一些函数的大体功能做了整理,便于个人使用

Read more »

最近由于工作上的需求重新整理了下Shiny资料,以及在网上找了些新的东西学习了下,一些个人觉得蛮适合shiny学习的资料在此分享一下。。。后续还会整理下实用的Shiny extend packages

Read more »

Odds ratio(OR)从字面上可看出,是两个odds的ratio,其用于:

在病例对照研究(case-control study)中,分析暴露风险因素与疾病(或者用药)的关联程度;主要是反映暴露与疾病之间关联强度的指标,OR常适用于病例对照研究,也可以运用于前瞻性的研究(当观察时间相等时)

与其相似的有个指标relative risk(RR),其可以理解为risk ratio,用于:

在队列研究(cohort study)中,分析暴露因素与发病的关联程度;主要是反映暴露与发病(死亡)关联强度的最有用的指标,RR适用于队列研究或随机对照试验。

Read more »

偏态分布(Skewed distribution)是指频数分布不对称,集中位置偏向一侧。若集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布。 偏态分布只有满足一定的条件(如样本例数够大等)才可以看做近似正态分布

对于偏态分布的资料可看:The Skew-Normal Probability Distribution

Read more »

摘抄整理自:《Mastering Shiny》 中的第7章 "User feedback"

为了让用户对于shiny app正在运行的功能有更好的了解,我们希望能以message或者其他输出形式对其进行说明解释,这个是属于Feedbac

Read more »

这是一本online版的shiny book, 《Mastering Shiny》,按照作者Hadley Wickham(真大神也。。)的说法,将于2020年在O'reilly系列中出版

Shiny is a framework for creating web applications using R code. It is designed primarily with data scientists in mind, and to that end, you can create pretty complicated Shiny apps with no knowledge of HTML, CSS, or JavaScript

Read more »

这是我整理的关于Spotfire的第三篇文章,主要记录下如何在Spotfire中安装Spotfire Statistics Services服务;由于网上相关资料比较少,而官方文档有些细节没写清楚,因此折腾了好久,因此记录下大致的过程。。。希望能帮助到大家,节省点时间哈(虽然用Spotfire的人真的不多)~

Read more »

上篇 Spotfire ironpython示例小结 主要整理了关于Spotfire中关于如何使用Ironpython来拓展Spotfire使用范围,即通过脚本来控制分析及展示的过程

这篇文章主要整理下关于Spotfire中TERR脚本使用注意事项,TERR是一个集成在Spotfire中的一个R版本,代码的函数以及R包的用法大部分都跟Open R(常见的R版本)一样,唯一需要注意的是如何将其结果输出到Spotfire的一些文档属性或者可视化图形中

Read more »

Spotfire是一个比较人性化的可视化软件,在药企(大外企)数据临床数据管理可视化方面应用较好

Spotfire除了自带的一些常用操作功能外,其内嵌了ironpython和TERR;以下是这段时间来整理的,关于一些功能的ironpython的实现

Spotfire-Ironpython主要社区: https://community.tibco.com/wiki/ironpython-scripting-tibco-spotfire

Read more »

平时常见的数据属性类型有连续和分类,然后在输入ML algorithms之前一般会转化为numerical matirx;除了上述两类数据外,还有一种是文本型数据,我们也需要通过一定的方法将其转化为numerical matirx

Read more »