目次
マスクド・アナライズさんの乾杯の挨拶からスタート
林さん
それではさっそくですが、まずはゲストのお二人の自己紹介をデータに携わるきっかけも含めてお願いします。
早坂さん
ヤンマーグリーンシステム株式会社のDX推進チームリーダーの早坂です。元々は、親会社であるヤンマーホールディングスに新卒入社し、経理出納や財務を担当していました。その後、現在の会社の企画部に出向し、経営企画として予算分析などの様々なデータに触れるうちに「アナログの課題」に直面しました。ちょうどそのタイミングでDXの波が社内外に到来していたこともあり、DX推進チームを立ち上げる機会を得て、リーダーとして活動しています。
遠藤さん
美容機器の製造販売を手掛ける株式会社ジェイメックで、社内初のデータ専門部署「データインサイト課」を立ち上げ、その責任者を務めています。小規模な会社なので企画半分、データ半分といった仕事の内訳ですね。正直、元々は別の会社でコンサルなどをしていて、転職した結果がデータの業務にも携わるようになったので、王道ルートの早坂さんと比べると私はキャリアも仕事も“ゲリラ”な感じがして対比が面白いなぁとすでに感じています(笑)。
林さん
今回の対談はルーレットでランダムにお題を決めて、お二人に回答いただければと思います。同じお題でも、正規軍の早坂さんと、ゲリラの遠藤さんの観点でそれぞれ面白い意見が伺えそうですね。それではルーレットスタート!
今回、ルーレットで決まったトピックは以下の6つです。その中から、1つだけピックアップして紹介します。
1. カオスなデータの経験
2. 膨大なデータの取捨選択
3. データの世界への飛び込みきっかけ
4. 組織内でのデータの浸透方法
5. データと人の心の関係
6. AI への向き合い方
全てのトークはPodcastで聞けるのでぜひチェックしてみましょう。
MCの林 美夢さん|データ界隈100人カイギコミュニティマネージャー
最初にルーレットが止まったのは「過去に見た中で最もカオスだったテーマは?」というお題。参加者のそれぞれが一度は経験しつつも、思い浮かべるデータや状況は十人十色なテーマではないでしょうか。遠藤さんは膨大な量の手書き資料の入力作業について、冗談混じりに答えてくれました。
遠藤さん
僕が前職の調査会社にいたとき、とある団体の調査案件を受けました。職員のみなさんが記入したアンケートを一度、パソコン入力してから分析する必要があったのですが、資料(アンケート)の山を見たときに絶望を感じたのを今でも覚えています。
林さん
どんなデータだったのですか?
遠藤さん
段ボール6箱分の紙のアンケートが計400冊。しかもクライアントは、かなりお堅い団体だったので1ページにびっしりと手書きで書いてありました。当時はAIなんてありませんからデータ入力は手作業で行いました。そもそも、どこまでデータにするのかも曖昧な中、職員のみなさんの字や表現の癖を読み取って作業するのは、本当にカオスな状況だったと思います。「日本語って難しいな」と思いました。
遠藤 尚也さん|
株式会社ジェイメック 営業本部 営業統括部 データインサイト課
チーフデータプランナー 兼 データインサイト課長
林さん
お話を伺うだけで絶望感が伝わります(笑)。具体的にはどのような内容の資料だったのでしょうか?
遠藤さん
団体の活動についてのアンケートで、実施した活動の内容や感想などが中心でした。数値の集計などは少なかったのですが、その分、文字がたくさんありました。
林さん
早坂さんはいかがでしょうか?
早坂さん
私もデータそのものというよりも、データを加工するプロセスが整理されていない状態になっていて、苦労した経験があります。というのも、データを取りまとめて分析する前に基幹システムとデータ照合などしてチェックを行うのですが「定義やルールが都度、変わって作られたデータ」が大きなボトルネックになっていました。その結果、なかなか整合が取れず、悩んだ経験があります。
林さん
具体的にはどのようなデータなのでしょうか?
早坂さん
代表的なのが「基幹システムに入っているデータが正しくない」ことを前提に作られているデータですね。システムから出力されたものではなく、人の手で加工に加工を重ねて作られたデータは再現性がありません。それを私が引き継いで作ろうとしても加工したタイミングでのルールを知らないし、そもそも暗黙知になっているので、何も知らない人が触ると100%間違いが生じてしまいます。そんなカオスな状況で「すぐに資料を作ってくれ」と言われたときは、さすがにウッとなりましたね(笑)。
早坂 翼さん|
ヤンマーグリーンシステム株式会社 企画部企画グループ DX 推進チームリーダー
林さん
データに手が加えられていると気付いたのは、どのタイミングでしたか?
早坂さん
データを印刷して突合し、一つひとつチェックしていたときのことです。
どうしても元データと合致しないものを見つけて、前任者に質問したところ発覚して経緯を聞いて「それは無理ですね」となりました。あと、備考欄にびっしりと情報を記載する人も少なくないのですが、Excelのフィルターが掛けられないため、手作業で分解していく必要があり、その対応にも苦労しました。
遠藤さん
わかります!重要度が高い順に赤、青、黒のように色分けしたデータも、目で見るとすごくわかりやすいのですが、CSVだと全部消えてしまうので……。加工するときに1色ずつソートして重要度のカラムを追加する作業をしたときには、(セルの枠に収まらない)人間の創造性が垣間見えましたね(笑)
林さん
自分だけの理解を深めるために、色を塗ってしまう気持ちは結構共感しちゃいます……。色々とお話をお聞きしていると、お二人ともAIの前時代というか、産業革命前の時代ならではの苦労とか積み重ねを感じますね。
遠藤さん
そうですね。ただ、カオスな状況も悪いことばかりではなくて、400冊分の手書きのアンケートのなかに職員のみなさんの「熱量」を感じることができたのは、とても良かったと思います。実際、案件の最後に行った報告の時にはデータには現れない想いまで伝えられましたから。
早坂さん
かなり同感です。先ほどの備考欄の件も、データとして残らない重要な情報が記載されることも多いです。現在でも、読み手が深く読み込まなければ把握できないケースは一定数残っていると感じています。
遠藤さん
そうなんですよね。僕たちのようにデータの仕事をしていると、データが優先順位の一番上のように考えがちですが、意外と副産物的なケースもあるんですよね。僕のカオスな状況も今となっては「選択肢にしておいてくれたら良かったのに」と思えるのですが、当時のクライアントにとってはきっと定性的な情報も含めて、手書きで残すのがベストだったのでしょう。
・間違ったデータが大前提で進む後続加工で加工が重ねられたデータあるあるで共感しました
・クォート混在やカンマ入りヘッダーのCSVなど複数システム結合あるあるにも頷きが止まりませんでした
・AI時代ならではの「読み込める範囲で満足してしまう」という新たなカオスの指摘が印象的でした
・データの保持期間はビジネスサイドとの対話で初動できる最低限に絞るという現場感に共感しました
・データは一つの事実でも捉え方や考察次第で人の心を動かせるという気づきが心に残りました
他のトークはPodcastで!
河原木良介さん|ITコンサルタント
第二部は15分ほどの短い時間でオフレコトークを開催。第一部から「データ界隈は意外と文系が多い?」という話題になり、会場でアンケートを取ったところ、なんと9割を超える人が文系だと明らかになりました。また、参加者から早坂さんや遠藤さんへの質問もあり、「見栄えが良いだけでは使われない」ダッシュボード活用の課題などについて議論されました。
MCの八巻 裕貴さん|データ界隈100人カイギコミュニティマネージャー
議論は「かっこいいだけのダッシュボードは見られない」という遠藤さんの経験則から始まり、褒められそうな数値や動きやすい数値があるスコアボードを取捨選択するほか、明細データやトランザクションデータなど必要最小限のデータに絞ること、敢えてグラフではなく達成率だけ掲載するなど、具体的な実践事例が挙げられました。
マスクド・アナライズさん|覆面AIコンサルタント
第三部は「マスクド・アナライズの書評1本勝負」でお馴染みのマスクド・アナライズさんによる講演が行われました。まずマスクド・アナライズさんは、AIについて理解を深めるうえでの「SNSで発信される情報の問題点」と、その知識を現場にそのまま持ち込んで失敗した事例を紹介しています。
社長がAI系のインフルエンサーの影響を受けてAI導入を決断するも、その内容が「薄っぺらい」という問題が現場で指摘された。導入後に活用は進まず、現場に余計な混乱を招く結果になってしまった
マスクド・アナライズさんは、「SNSは情報の正確性よりも注目を集めることが優先されるため、事実の歪曲や誇張、極端な表現が使われるケースが非常に多い」と主張。その具体的な事例として、クラウドワークス社の決算における利益の大幅減少に触れ「SNSではクラウドワーカーの仕事が『AIに奪われた』という主張がまるで当然のように広がっているが、実際は人材採用を増やしたから利益が減ったのが大きな理由だ」と指摘しました。
一方、書籍にはSNSの情報発信者にはない「出版責任」や「事実検証する制作プロセス」があるため信頼性が高く、理論的背景から理解できるため、マスクド・アナライズさんは本による学びを推奨しているのです。特にAIについて、以下の4つのステップで読書する方法をおすすめしていました。
1. 基礎知識の習得:信頼できる本を読んでAIの基本を学ぶ
2. 自分に合わせた理解:自社の業務や事業内容に適用可能な知識を得る
3. 試行錯誤と実践:学んだ知識を実際に適用し、改善を繰り返す
4. 組織全体での活用:個人の学習から会社全体での活用へ展開
また、書籍でも「誰でも儲かる副業」のような都合の良い主張に対して根拠が薄いもの、「幸せになれる」「幸運を呼び込む」など精神論に傾倒したスピリチュアル、「生成AIを知らない人は失業する」といった煽動的、脅迫的な本は注意すべきだと挙げています。マスクド・アナライズさんは、AIのおすすめ本も記事で紹介しているので、ぜひ気になる本をチェックしてみてください!
第二回となった「データ界隈100人カイギスピンオフイベント」は、普段なかなかつながるきっかけの少ないデータ界隈の人たちが、ざっくばらんに話せる貴重な機会です。Podcastやレポート記事だけでは、伝えられない雰囲気もあるので気軽に参加してください。運営メンバー一同、お待ちしています!
(TEXT:藤冨啓之 写真:PHOTO:渡邉大智)
データ界隈100人カイギとは?
データサイエンティストやエンジニアなど、データに関わる多様な人々が自身の活動や想いを語る隔月開催のオン・オフラインコミュニティイベント。毎回5名のゲストが登壇し、累計100人の登壇者に達した時点で終了するのが特徴であり、データを通じた「ゆるい繋がり」を作り、キャリアや知見を共有する場となっている。
詳細はこちらメルマガ登録をしていただくと、記事やイベントなどの最新情報をお届けいたします。
30秒で理解!インフォグラフィックや動画で解説!フォローして『1日1記事』インプットしよう!
データ越境者に寄り添うメデイア「データのじかん」が提供する便利ツールです。
本ツールは、JavaScriptを用いてお客様のブラウザ上で処理を行います。サーバーとの通信は行われず、入力データはお客様のみの端末内で処理されます。
データ界隈100人カイギ「データをつまみに語りませんか?」の公開収録スタートです!私はMC兼コミュニティマネージャーの林美夢と申します。ご参加いただいた皆さま、とりあえず乾杯しましょう!