データサイエンティストの3つの構成要素は
・データサイエンス力(数学や統計)
・エンジニア力
・ビジネス力
であると言われていますが、データサイエンティストの資格を持っているひろゆきさんはこの考え方を正しいと思いますか?
また、この考え方の中でビジネス力を鍛えるのがなかなか難しいなと思っているのですが、どのように鍛えると良いでしょうか?
また、ほかに大事な要素はありますか?
なぜその3つなの?
別にビジネス力なんかいらねぇんじゃね?って思います。
普通の会社って営業してくれる人とエンジニアっていう2チームに分かれてるので、ちゃんと営業力のある人がいれば別にビジネス力はいらないと思うんだよね。
自分自身で会社を作って、こういう数字を弄ってこんな結果出せますよ~みたいな提案書を作って提案するとかであればビジネス力は必要、と思うんですけども。
素直にエンジニア力さえあれば、なんとかなるんじゃないかなと思っていますけど。
データサイエンス力とエンジニア力が何で分かれているのか分からないんですけど。
実はドカタ作業
ただ結局、机上のデータサイエンスって言われるような難しい作業ってそんなに無いんですよ。
例えば…
実際の作業
・データがあります
・うまくイジって良い結果を出す形で、何かの結論を出してください。
っていうのを机上ではやれるんですけど、実際問題使わなきゃいけないデータっていうのがきれいに機械が読み込めるような状態になっていないことが多いんですよね。
結局、正規化と言われるデータをきれいにしてコンピューターが読みやすくする作業っていう肉体労働、落ち穂拾いに近いような。
落穂拾い(おちぼひろい)は、穀物の収穫後に、または収穫に加えるために、田畑に散らばる穂を拾い集めること。
例えば本って出版するときに誤字脱字を一生懸命探す校正さんという仕事があるんですけども。
その校正さんっていう感じで…。

いろいろなミドルウェア等を使ってエンジニアとしてすごい頑張ります!
めっちゃ給料もらいます!
みたいな話になるんだけど、実際やってみると必要なデータの中で「このデータ使えねーだろ」っていうのを弾く作業だったりするのですよ。
もうグチャグチャ…
例えば、全部英語だと思っていたら、その中に1人だけ中国人が混じってたせいで文字コードを中国語で認識してしまって文字化けが大量に起こるとか。
「中国」関連話
-
中国のビッグデータ活用事例と取り残される日本
相対的な話で、僕らは「民主主義が正しい」と思っているわけじゃ ...
続きを見る
全部英語だと思ってたら実はその中にドイツ人が混じってて、何か変な記号が入っちゃって記号のせいでカンマが読み込めなくなっちゃってデータが壊れちゃうみたいなw
何か予想してないことって結構あったりするんですよね。
「ドイツ人」関連話
-
ひろゆきドイツで無賃乗車して連行されていた
質問者急ですが人間の面白さって何だと思いますか? 私は田舎か ...
続きを見る
普通に住所・名前・電話番号って書いてあると思ったら、住所の欄と電話番号を間違えて書いちゃった人がいて、住所として取り扱っていたらなぜか数字だけの謎の住所が出てきて、

みたいなのが来て手作業で入れ替えるみたいな・・・。
他にも名前のふりがながないとか、名前と苗字を逆にしてるとか、男女の性別逆にしてるとか、最近のオシャレ性別みたいなので男か女か答えたくない、みたいなことになって。
そもそもデータとして性別に答えたくないわ、男として扱うのか女として扱うとか決まってなくて、何か不思議な結果になっちゃったみたいな…。
「性別」関連話
-
【イグノーベル賞】世界中の辞書が書き直し!
質問者動物ってオスとメスで差がないと思います。 人間だけ女性 ...
続きを見る
というのがやたらいっぱいあるし世の中って・・・。
給料高いからがんばれ
結局プログラムを組んで物事がうまくいくよねっていうのだと思ったら、その前のデータをひたすら見てこのエラーが出たから、絶対このデータが間違っているからこのデータを直すみたいなっていう…。
細かい作業が多いので、なかなか思いどおりに簡単な感じにはならないので。。。
高給をもらえると思いますけど頑張ってください!
「給料」関連話
-
【お悩み相談】サラリーマンが給料を増やす3つの方法
・経理で働く35歳 ・大手建設会社勤務25歳 ・残業で評価さ ...
続きを見る
「給料」関連話
-
勤勉を誇る先には非正規雇用~真面目だけが取り柄の人の末路
質問者22歳無職です。 SEとして採用されたいのですが、ニー ...
続きを見る