いま始めましょう
DataHub リリースを記念し、病変および肺野のセグメンテーション付き肺がんCTデータセット(152症例)を無料公開中です。公開データセットにアノテーションを付与しており、商用利用も可能です。
さらに、DataHub 2周年を記念し、病変BBox付きの肺がん疑いX線データセット(50症例)と、病変セグメンテーション付きの前立腺がんMRIデータセット(PI-RADS 4・5、50症例)も無料配布しています。こちらはいずれも日本のデータセットで、商用利用可能です。
日本からの匿名加工済みデータセットをお探しですか?
高品質な正解付き医用画像データセットをお探しですか?
特定疾患を含む放射線画像/病理画像と臨床情報、分子データをお探しですか?
私たちにできること

1. AIパフォーマンスの向上

2. 研究開発サイクルの短縮

3. 研究開発コストの削減
1. AIパフォーマンスの向上
私たちは、AIモデルの精度・ロバスト性・機能性の向上に貢献する、学習・評価用の高品質な放射線/病理画像、臨床情報、分子データを、数百万症例規模で提供しています。必要に応じてアノテーションも付与できます。

放射線画像と病理画像
放射線画像(X線, CT, MRI, マンモグラフィ, PETなど)、超音波画像、病理画像(WSI)。

アノテーション
疾患のセグメンテーションおよび診断レポートは、放射線科医/病理医によってアノテーションとダブルチェックされます。肺野のセグメンテーションもあります。*アノテーションは、通常、主要疾患に関してのみ提供できます。

臨床情報
年齢、性別、身長、体重、既往歴/家族歴、手術歴、主訴、主要症状/経過、看護観察記録、紹介科、診断名など。分子データも提供可能な場合があります(例:乳がんの場合、ER, PgR, HER2などの陽性/陰性結果)。


2. 研究開発サイクルの短縮
当社の商用利用可能なデータセットは、倫理審査・匿名加工・取捨選択・標準化(・アノテーション)されており、医療AIや創薬AI、臨床研究にすぐ利用できる形で提供されます。データセットのサンプル提供、データセットのカスタマイズ、データ関連のコンサル(医学的フィードバック・カスタムAI開発・医療機器規制対応サポートなど)も行っています。

倫理的に取得されたデータ
倫理的に適切な手続きを経て取得されており、データは二次利用可能です。

匿名加工済み
個人情報保護法に則って厳格に匿名加工されているため、コンプライアンスリスクはありません。

取捨選択と標準化済み
合併症を含む症例やノイズが多い症例など、医療AIに不適切なデータは除外されています。また、画像情報・臨床情報・分子データ・アノテーションは全て標準化されているため、追加の前処理と確認作業は最小限で済みます。
3. 研究開発コストの削減
もう自社で医療データの収集~取捨選択~アノテーション~標準化を行う必要はありません。当社のデータセットの用途は多岐にわたり、医療AI・創薬AI・臨床試験など、幅広い研究開発において利活用できます。
医療AI
例:画像診断、自動輪郭抽出、線量分布作成
創薬AI
例:薬剤スクリーニング、バイオマーカー探索、治療標的同定
臨床試験
例:臨床試験設計、薬剤の毒性/有効性評価、病理組織学的評価


FAQ
よくある質問
放射線画像:DICOMまたはNIfTI 放射線画像のアノテーション:セグメンテーションはNRRDまたはNIfTI、BBoxを含む物体検出はJSON 病理画像:TIFFまたはDICOMまたはiSyntaxまたはNDPI 病理画像のアノテーション:GeoJSON 臨床情報(分子データと診断レポートを含む):EXCEL
画像品質、撮影条件、診断名、所見文、臨床情報、アノテーション内容の整合性を確認します。必要に応じて、ノイズや欠損を含むなどの不適切症例の除外や、データ形式の標準化を行います。アノテーションは、疾患やモダリティに応じて、放射線科医、病理医、整形外科医などの専門医、または医用画像に精通した技師が実施します。難易度や要件に応じて、一次アノテーションを技師が担当し、専門医が確認する体制も可能です。アノテーションの種類は、セグメンテーション、バウンディングボックス、分類ラベル、診断ラベル、所見情報など、データセットごとに異なります。
はい、臨床情報、メタデータ、画像データに含まれる患者ID、氏名、生年月日、検査日など、個人を識別し得る情報を削除または加工した上で提供します。画像内に個人情報が焼き込まれている場合や、顔面など個人識別につながる可能性のある情報が含まれる場合には、解析への影響を最小限に抑えつつ、必要に応じてマスキング等の処理を行います。
はい、各医療施設における適切な手続きに基づき、二次利用可能な形で取得・提供されます。データセットごとに、倫理審査、オプトアウト、同意取得、医療施設内での承認など、必要な取得条件を確認した上で提供します。
はい、医療AI、創薬AI、医療機器、臨床研究などの研究開発目的で利用可能です。外部委託先との共同利用、薬事申請、論文発表、マーケティング資料への利用についても対応可能です。また、海外企業への提供も可能です。
価格は、データの量、希少性、臨床データ・分子データ・アノテーションの有無によって変動します。詳細については、お問い合わせください。
請求書を発行しますので、お振込をお願いします。
疾患、モダリティ、部位、症例数、撮影条件、メーカー、スライス厚、臨床情報、分子データ、アノテーション種別、除外条件などを指定できます。既存データセットからの抽出に加え、要件に応じて追加アノテーションや新規データセット構築についても相談可能です。
はい、画像情報・DICOMタグ・臨床情報・アノテーション方法が、お客様のニーズに合うかご判断いただくために、2-5症例程度のサンプルデータを提供しています。
既存データセットの場合、通常1〜2週間程度で納品可能です。カスタムデータセットや追加アノテーションが必要な場合は、症例数、疾患、モダリティ、アノテーション内容、臨床情報の有無などによって納期が変わりますが、通常1〜2カ月程度が目安です。データは、原則としてBox等のセキュアなクラウドストレージを通じて、パスワード付きファイルとして提供します。
はい、医学的フィードバック、カスタムAI開発、医療機器規制対応サポートなどを提供できます。Callistoのチームは、医療AIエンジニア・MLOpsエンジニア・ソフトウェアエンジニア・放射線診断医・放射線治療医・病理医・データセット管理者などで構成されています。特に当社CEOのカリスは、日本一の若手医療AI研究者です(主著論文引用数:2,000回以上)。
Callisto DataHubは、医療AI・臨床研究向けの医用画像データプラットフォームを運営する、カリスト株式会社によって提供されています。
カスタムデータが必要ですか?
お探しの条件をお聞かせください。
