数据库名称:SAS SQL
数据库版本:9.4
内容/问题描述:
我有table a和b
table a
date SID doctor
2019/1/1 a jack
2019/1/2 a jack
2019/1/3 a jack
2019/2/1 b ben
2019/2/2 b ben
2019/2/3 b ben
...
2019/2/15 b mark
2019/2/16 b mark
2019/2/17 b mark
table b
date SID doctor
2018/1/1 a jack
2018/1/2 b jack
2018/1/3 c jack
2018/1/15 a jack
2018/1/31 a ben
2018/3/1 b ben
2018/3/1 c mark
2018/4/16 d mark
2018/4/21 c mark
我要得到下面的结果
table c
date SID doctor doctor_service_volume
2019/1/1 a jack 3
2019/1/2 a jack 3
2019/1/3 a jack 2
2019/2/1 b ben 1
2019/2/2 b ben 1
2019/2/3 b ben 1
...
2019/2/15 b mark 2
2019/2/16 b mark 2
2019/2/17 b mark 2
我要计算table a每一笔,a.doctor在a.date过去一年内收过多少病人(不重复)
table b是处方签资料
例如:
first row in table a
date SID doctor
2019/1/1 a jack
我就要从table b中去找docor jack在a.date和(a.date - 1 year)间
收了多少不重复的病人
table b doctor jack 在2018/1/1 ~ 2019/1/1开过处方签的病人
date SID doctor
2018/1/1 a jack
2018/1/2 b jack
2018/1/3 c jack
2018/1/15 a jack (重复)
所以a.doctor_service_volume = 3
我自己写的code如下
Proc sql;
create table want as select
a.*, (select count(distinct b.SID)
from
dataset a, dataset b
where
a.DoctorID = b.DoctorID and a.DoctorID is not missing and
b.prescriptiondate between a.prescriptionBeginDate and
intnx('year', a.PrescriptionBeginDate, -1, 'same'))
as service_volume
from
dataset a, dataset b;
quit;
因为跑很久,我不太确定这样写是不是可以得到我要的结果..
table a 有240万笔,b有1600万笔
如果大家要测试自己code写得对不对,会怎么弄?