目次
オッズ(Odds)と有病割合(Prevalence)
$$Odds=\frac{病気の人の人数}{病気でない人の人数}$$
$$Prevalence = \frac{病気の人の人数}{集団の人数}$$
Prevalenceは、全体の数が分母にくるため一般的に理解しやすい。が、Oddsは、病気でない人が分母にくるため、ちょっと特殊。
OddsとPrevalenceの関係
有病割合が十分に低ければ、オッズと有病割合は近似できる。実際にグラフで見てみると、1万人の集団で、患者数を1人から増やし行く場合の、OddsとPrevalenceの関係は、
dat <- tibble(
dx = 1:8000,
tot = 10000
) %>%
mutate(nondx = tot - dx)
gdat <- dat %>%
mutate(
odds = dx/nondx,
prevalence = dx/tot
) %>%
pivot_longer(cols = c(odds, prevalence))
gg <- ggplot(gdat) +
geom_line(aes(x = dx, y = value, color = name)) +
scale_color_discrete(name = NULL) +
labs(x = "病気の人の数", y = "値") +
ggthemes::theme_tufte()
gg

ここで、Prevalenceが十分に小さければ、
$$Prevalence \approx Odds$$
と近似できる。
gg + coord_cartesian(xlim = c(0,2000), ylim = c(0,1)) +
geom_vline(xintercept = 1000, linetype = "dashed")

特に、prevalenceが0.1までの範囲であれば、かなり良い近似(グラフの点線)
コメント