接续前文, 下文有许多专有名次, 建议参考前文.
这次更多的聊聊在Clinical trail产业中, statistical programmer常用的SAS function
及procedure.
在案子开始的时候, 统计师便会根据Protocol以及SAP撰写Mock-up shell.
一般来说, Mock-up shell基本上就是将protocol/SAP的内容, 利用表格(Table), 列表(L
isting)及图像(Figure)的方式呈现出来.
为了顺理产出 TFLs, 我们会将资料整理成便于分析的形式, 一般称做SDTM及ADaM.
顺序为: 原始资料 (Raw data) – SDTM datasets – ADaM datasets – TFLs. 原始资
料可能来自各式各样的数据库, 常见的有RAVE, OC等等.
接下来就来介绍一下常用的SAS function及proc:
一般最常见的资料整理步骤, 都会这边出现, 使用方式请参考SAS support或Google:
文字处理function:
index, tranwrd, translate, strip, compress, index, substr, length, cmiss, ifc,
upcase, lowcase, propcase, put/input, repeat, reverse, cat系列 (cat, cats, ca
tx,..), prx系列 (Perl Regular Expressions, 例如prxmatch, prxchange), any系列 (
anyalpha, anydigit,…)
Detail: https://support.sas.com/publishing/pubcat/chaps/59343.pdf
数字处理function: abs, sqrt, max, min, std, sum, log, lag, dif, round, put/inp
ut, floor, ceil, nmiss, date, date/timepart, datetime, dhms, intck等等
Procedure:
大家最常用的data step 里面常用的指令有: _null_, by, where, keep, drop, if, set
, end, by, retain, first, last, array, do…end loop等等
资料处理: append, copy, cport, compare, content, datasets, export, format, imp
ort, print, printto, sort, SQL (我个人百分之90的资料处理倚靠SQL), transpose,…
统计分析: boxplot, freq, genmod, glimmix, glm, gplot, iml, logistic, lifetest,
mcmc, means, mixed, phreq, req, report (输出报表), sgplot, sgrender (combine
with GTL language), summary, template, univariate,…
Detail: https://support.sas.com/documentation/cdl/en/allprodsproc/63875/HTML/d
efault/viewer.htm#a003135046.htm
这篇文章稍微写出的在临床试验中, 一般statistical programmer日常会使用到的SAS fu
nction及procedure, 当然每间公司使用的习惯跟作业系统会有十分大的出入, 例如SAS背
后是UNIX或者是Windows? 是EG 版本吗? 这些都会影响每个人在使用上的习惯.
同时, 这篇文章并没有打算详细介绍每个function/procedure, 仅仅是抛块砖头, 希望可
以帮助想要进入/或刚进入这个产业, 如同五年前的我一般迷惘的每个人.
敬请各位指教.