第17回研究報告会記録


日時:2000年12月9日(土)10:00〜17:00
会場:統計数理研究所講堂
出席者:会員22名,非会員16名
大隅昇(統計数理研究所),吉村宰(岡山大学)両会員に特別講演をお願いした.また9件の一般発表があり,活発かつ有意義な討論が行われた.

当日のプログラムは,こちら



◆特別講演
電子的データ取得法とインターネット調査のあり方 −実験調査にみるWeb調査の実状−

講演1 大隅 昇(統計数理研究所調査実験解析研究系)

コンピュータ利用による電子的調査情報収集法 (CASIC:Computer-assisted Survey Information Collection)が広く利用されるようになってきた.その一例がインターネット利用環境の急速な普及と多彩なネットワーク技術に支えられた,いわゆる「インターネット調査」である.実はインターネット調査への過剰な期待があり,しかもインターネット・マーケティングとの違いも十分に理解されないままに粗雑に利用されてきたのが現状である.また,国内におけるインターネット調査への認識,利用環境や利用方法と,欧米諸国のそれとの間には大きな乖離がある.CASICとは何か,またインターネット調査とは何か,インターネット調査を実務場面で利用する場合の問題点,適用可能性をどう考えるのかが十分に議論されてきたとは限らない.
とくに日本国内の場合,従来の伝統的な調査法や実査環境の急激な変化もあって,インターネット調査の実用場面への導入・普及が急速に進んだように見えるが,その反面,調査法としての科学的な検証や実証研究はなおざりにされたままである.例えば,回答者の捕捉方法・代表性,サンプリングの問題,調査票の設計・設問構成,集計上の諸問題(妥当性・信頼性チェック等),定性情報(自由回答等)の利用法等々,その検討事項を整理するだけでも容易ではないが,残念ながら,現実にはこれらのどれもが正しく認識・理解されているとは言い難い.そこで,我々研究者グループと調査機関・企業による産学共同研究を計画し,国内初の大規模な実験調査を約3年前から実施してきた.これらの実験調査の概要と研究成果を示すと共に,一連の実験調査で見られた諸事象,多くの問題点,それらの解決に向けての試案についての提言を行う.


講演2 吉村 宰(岡山大学教育学部)

1999年及び2000年に民間の調査会社数社の協力を得て,WEB上での同時比較実験調査を実施した.実験調査の基本方針は,複数のWEBサイト上でほぼ同時期に同じ設問を用いた調査を行う,可能な限り同じ設問を用いた従来型調査をほぼ同時期に行う,他調査調査(例えば,統計数理研究所による日本人の国民性調査)で用いられた設問を用いる,ほぼ同時期に可能な限り同じ設問を用いた従来型の調査を行う,そしてそれを継続的に行う,である.異なるWEBサイト間及び従来調査との比較から,WEB調査における「回答者像」と言えそうな特徴がいくつか見えてきた.まず,WEB調査における回答者は,20代後半・40代前半が中心であり,頻繁にWEB上での調査に参加している(回答者の約6割が月に一度以上何らかの調査に参加).
このことと,WEB上での種々のアンケート・調査サービスへの登録状況を併せて考えると,WEB調査における回答者は,インターネット利用者の中の比較的限られた少数の集団であることが推察される.また,回答者の多くは,調査協力条件として「調査が信頼できる」ことを挙げるが,一方で,謝礼や懸賞を目的とする者も多い.
インターネットとの関わりについては,生活に深く浸透しており,男性では情報収集の手段として,女性ではコミュニケーションの手段としての利用が目立つ.インターネットの回答者の生活に占める位置付けは高いが,TVなど他のメディアへの接触が少ないわけではない.また,インターネット上での自分自身の個人情報の管理・把握への関心が高い.
人物像については,他調査への回答者に比べ,現在の生活への満足度が高く,あっさりした人間関係を好み,仕事には達成感ややりがいを求める,というような特徴を持つと言える.ただし,上述の「回答者像」は,あくまでも今回の実験調査で取得されたデータに内在する特徴として捉えるべきものである.実験調査の調査対象が,インターネット・ユーザー全体を代表するものではないことは言うまでもないことであり(代表性を持つような標本抽出は現段階では不可能である),さらに,回答者が,系統的な偏りをもった調査対象の一部であることが今回の実験調査の結果から明らかである.こうした限界を十分に考慮した上で,なおかつWEB上で取得されたデータの利用を考えるならば,少なくとも,(1)同時に複数の調査を継続的に行うことで,(2)当該調査における回答者の特徴を可能な限り明確にし,(3)取得されたデータの解釈及び適用範囲の限界を定める,ことが必要である.


◆一般発表
HLAによる人の分類の試み

林 文(東洋英和女学院大学人間科学部)

HLA抗原遺伝子のデータを構造として捉えることにより,HLAによる人の分類を試みてきたが,新たな視点での分類を試みた.分類が妥当かどうかは今後の臨床的検討によるが,分類の方法と臨床データとの関連づけを行っていくことにより,HLA抗原遺伝子のもつ意味が総合的な現象として把握できると考える.


脳卒中片麻痺患者の歩行移動動作能力分類

清水和彦,松永篤彦,長澤 弘,宮原英夫(北里大学医療衛生学部)

脳卒中片麻痺患者の歩行移動動作の各テスト場面に難易度づけが可能か,患者の能力に順位付けが可能か,また総合的に判断される評定(実用度分類)を支持するか検討した.
発症後2年以内の患者187名を対象として,32場面3条件のテストを用いて測定し, 実用度分類は6段階評定を行った.
主成分分析の結果,32場面のテスト項目に難易度付けができ,187名の症例も能力別に順位付けが可能であった.6段階の実用度分類が各症例の主成分得点で判別可能か,判別分析を行ったところ84.3%を判別することが可能であった.


薬価変動の治療費への影響の考察

矢島敬二(東京理科大学経営学部)

本研究は1995年から1998年までの癌治療に関するレセプトデータを基礎に薬価の変動と治療費の変動との関係を論ずるものである.そのなかで特に1997年4月の薬価改定は官報によると薬価ベースで4.4%,医療費ベースで1.27%の引き下げといわれているが癌治療に関する当該データでは化学療法費用については1.4%の減少を認められるが総治療費では1.2%の増加となることを示す.


要介護度認定で利用されるモデル状態像60例のクラスター分析

白鷹増男,松永篤彦,清水和彦,宮原英夫(北里大学医療系研究科)

わが国では公的な介護サービスの利用希望者は,申請して介護認定を受けなければならない.介護度を決定するに当たって,介護認定委員会のメンバーは申請者の状態をモデルの状態像と比較して,もっとも似ているモデルの介護度を選択する.厚生省は要介護認定の参考資料として要介護度別に10例づつ計60例のモデル状態像を提示している.各状態像は7個の中間評価得点で表わされている.私たちは,この60例に対してクラスター分析(ウオード法)を実施し,状態像相互の関係を調べると共に,形成されるサブグループと,厚生省が用意した6段階の介護度との関係を調べた.その結果,介護度が低い症例,すなわち要支援,要介護1,要介護2の症例は,距離を用いて介護度別に分離できた.一方,介護度の高い要介護4と要介護5の症例は距離を用いて分離できなかった.この結果は,実際に介護認定に携わっている一委員が,感じている印象と相容れるものであった.


50種の社会的意見の3次元分類

三土修平(東京理科大学理学部)

本報告は,筆者が1996年に実施した意識調査の分析結果である.その調査では,学生286名を被験者として,現代日本で論じられることの多い政治的・社会的・倫理的テーマについての50種類の代表的意見項目を示し,各人の賛成度を4段階の選択肢方式で答えさせた.因子分析によって8個の因子が得られた.ここであらためて,意見項目を被験者,因子を変量,因子負荷量をデータとみなす観点から二次的分析を実行したところ,50個の意見項目の位置関係を3次元空間内の布置として,簡潔に整理することができた.


ハイブリッドモデリングのPOSデータへの適用

鈴木督久(日経リサーチ)
大滝 厚(明治大学理工学部)

データマイニングをして応答変数の線形および非線形な変動部分を説明する最適モデルを作るために,POSデータの特徴を把握したうえで,CARTと線形回帰分析を組み合わせたハイブリッドモデリング戦略を提案する.この戦略を検証するために,POSデータに適用し以下のような有益な結果を得た.
(1)ハイブリッドモデリングは,単独のCARTまたは回帰モデルの精度を改善できる.
(2)欠損値(売上無ではなく,棚に商品が存在しない状態値)を持つケースは代理変数によって対処できる.
(3)ハイブリッド後の残差の系列相関とその残差平均平方は,自己回帰モデルを適用することで改善できる.


アブダクションとMDLを用いたテキストデータマイニング

石塚隆男(亜細亜大学経営学部)

本研究では,テキストデータマイニングの結果を評価し,仮説や知識を得るための方法について検討を行った.具体的には,テキストを構成する概念の置換によりアブダクションやメタファー生成を行い,さらに意味のある仮説の評価においてMDL原理の適用可能性について検討を行った.意味のある仮説を生成するためには,仮説の候補を可能性規準,常識除外規準並びに知識としての利用可能性規準の観点から評価することが必要である.可視化された情報を評価する方法としてケチの原理に基づくMDLは単純さを重視しており,有望であると考えられる.


ストレス・疲労関連語と項目反応との関係

土井聖陽(宮崎産業経営大学経営学部)
大隅 昇(統計数理研究所)

62名の男子大学生にストレスに関連する情動反応の自由回答と疲労感,攻撃性そして消耗感に関する3種類の項目尺度を実施した.3種類の尺度の平均点はいずれも低かったが,自由回答では,その3種類の情動に関する語が多く得られた.両結果の違いは、自由回答で得られた語の多くが,項目で使われている語と異なっていたり,複数の情動に関係していたためと言えよう.さらに本研究は,自由回答と項目尺度の併用の重要性の有効性を示したと考えられる.


WEB上で取得されたビール及び発泡酒に対する自由連想データの解析

吉村 宰(岡山大学教育学部)
田村 玄((株)ビデオリサーチeマーケティング室)

同時期に実施した従来型の調査と比較することによって,WEB上で得られたビールあるいは発泡酒10銘柄に対する自由連想データの特徴抽出を試みた.主な結果は次の通りである.WEB調査では,従来型に比べ,1)設問への記入率が高い,2)回答が長い,3)テレビコマーシャルを反映した回答が多い.これらの結果をふまえ,WEB上での自由記述データ取得法,利用法について議論した.