はじめに
統計でよく使われているソフトJMPの使い方を簡単にまとめます。
- 患者背景のまとめ
- ある因子Xの2群間比較
- ある因子Xにおけるカプランマイヤー曲線(生存曲線)
- 単変量・多変量解析
ちなみに統計の専門ではありません。逆に使い方を悩んで使用して出来るようになったため、簡単に時間をかけずに初心者の方の役に立てたらと思います。
下準備

まずは、このように必要な情報をエクセルにまとめていきます。

あとで必要になるのでエクセルとJMPで使いやすいようにしておきます。
年齢や体重など数字自体に意味があるものは変更が必要です。

年齢の部分を選択して右上の標準のところを選択します。

数値を選択します。
とりあえずこれでいったんJMPを開きます。
1. 患者背景のまとめ
N=20 | |
年齢(歳) | 63.5 (40- 85) |
性別 [ 男 / 女 ] | 12(60.0%)/ 8(40.0%) |
病名 [ A / B / C ] | 12(60.0%)/ 5(25.0%)/ 3(15.0%) |
体重(㎏) | 59.5( 40 – 86 ) |
因子X[ あり / なし ] | 14(70.0%)/6(30.0%) |
今の情報を上記のような表を作成する際にもJMPで簡単にできます。
まずはJMPを開きます。

このように表示されます。

次に上の【分析】を選択し、
【一変量の分布】を選択

必要な項目を選択し(下矢印部分)
【Y.列】を選択、【OK】を選択

下準備で数値に変更した列である、年齢や体重のように連続尺度を用いているものは、このように表示されます。
中央値や最小値、最大値などいろんな情報が一瞬で解析できます。
それを表に埋めていきます。

性別などもすぐに男性の数、女性の数、全体における割合も即座に解析してくれます。
このようにして患者背景のまとめを簡単に作成できます。
2. 二群間比較
因子X あり(n =14 ) | 因子X なし(n =6) | P値 | |
年齢(歳)[≧64, <64 ] | 7(50.0%)/7(50.0%) | 3(50.0%)/3(50.0%) | 1.000 |
性別 [ 男 / 女 ] | 8(57.1%)/ 6(42.9%) | 4(66.6%)/2(33.3%) | 1.000 |
病名 [ A / B or C ] | 8(57.1%)/ 6(42.9%) | 4(66.7%)/ 2(33.3%) | 1.000 |
体重(㎏)[ ≧59.5 / <59.5 ] | 6(42.9%)/8(57.1%) | 4(66.7%)/2(33.3%) | 0.629 |
上記のような表を作成できます。
いったんエクセルに戻り、二群間比較ができるように調整します。

例えば、年齢は先ほどの患者背景のまとめで行った解析では、中央値が63.5歳となりました。
そのため、高齢群(64歳以上)、低年齢群(63歳以下)と2群に分け、高齢群をH、低年齢群をLとしました。
それを解析用の列を作成し、上記のエクセルのように埋めていきます。
また、病名はA、B、Cの3群となっており、解析できないので、無理やり2群に分けます。(解析に意味が出来そうに自分で分けてください。)
今回はAとBCと2群に分け、Aを1と決めました。
後で、カプランマイヤーによる生存曲線を描くときに必要なので、打ち切りも記載しておくとよいと思います。
生存を1、死亡を0とすると後でやりやすいです。

また、JMPを開いて【分析】→【二変量の関係】を選択

2群に分けたい項目を【X.説明変数】に入力。
その因子における、年齢や性別などの調べたい項目を【Y.目的変数】に入力。
OKを選択。

これで、2群間の表に入力し、表が完成します。
P値も下の部分の赤丸に記載されています。
3. カプランマイヤー曲線(Kaplan-Meier曲線)

カプランマイヤー曲線は上記のような生存曲線のことです。
では、実際JMPを用いて行います。

【分析】→【信頼性/生存時間分析】→【生存時間分析】を選択。

上の図のように、検討したい2群をグループ変数に入力、Y.イベントまでの時間に生存期間などを入力。
打ち切りを入力してOK。
注意:エクセルの打ち切りの1と0が生存、死亡で逆になっていると変なグラフが完成します。

このようになります。
これでも良いですが、グラフの縦軸、横軸などを好きなように変更してください。

それぞれ右クリックで好きなように変更できます。横軸のメモリは、12か月ごとにするとわかりやすいかもしれません。


さらにイベントを点や行マーカーとするとわかりやすいグラフになります。

グラフのコピーを選択すると、PowerPointなどに張り付けても綺麗に貼れます。

これで完成です。
最後に単変量・多変量解析まで行きましょう。
4. 単変量・多変量解析

今回の分では症例数が少ないので、意味があるか分かりませんが、やり方を記載します。
単変量解析から

【分析】→【モデルのあてはめ】

比例ハザードを選択

各項目の入力。変数を下のところに入れます。
図では、性別を入力しています。
実行。
その後、下の図のように出てきますので、上の部分の赤下矢印を選択して、リスク比を選択。


すると一番下にリスク比が表示されます。それを表に入力していきます。
それを一つずつ行っていき、表の左部分の単変量解析が終わります。
次に多変量解析。
今回は項目数が少ないので、全て入れていきます。

項目の部分が性別だけでなく、年齢、病名、体重、因子Xが入っています。
実行。

このようになります。
また、上の赤下矢印からリスク比を選択。(単変量と同じです。)

すると下の部分に、リスク比がそれぞれ出てきますので、表の右側に入力して完成です。
今回の結果で言うと、
「因子Xは生存期間延長に有意な独立因子と言える」
と締めくれる結果となりました。
最後に
例が20例と少なく、統計学的に意味が無いとですが、JMPの使い方の参考となれば幸いです。
JMPでの解析は他にもいろいろと可能です。
書籍では、JMPでの勉強は、これが一番オススメです。

統計学は難しいですが、こちらはマンガでわかる統計学。目次も読めるので、一度試し読みしてみてください。
カテゴリーでのベストセラーも獲得されている本です。
コメント