仕事 社会

【デジタル土方】希望と夢と現実と

2021-09-02

データサイエンティストの3つの構成要素は

・データサイエンス力(数学や統計)

・エンジニア力

・ビジネス力

であると言われていますが、データサイエンティストの資格を持っているひろゆきさんはこの考え方を正しいと思いますか?

また、この考え方の中でビジネス力を鍛えるのがなかなか難しいなと思っているのですが、どのように鍛えると良いでしょうか?

また、ほかに大事な要素はありますか?

 

なぜその3つなの?

別にビジネス力なんかいらねぇんじゃね?って思います。

普通の会社って営業してくれる人とエンジニアっていう2チームに分かれてるので、ちゃんと営業力のある人がいれば別にビジネス力はいらないと思うんだよね。

提案書

自分自身で会社を作って、こういう数字を弄ってこんな結果出せますよ~みたいな提案書を作って提案するとかであればビジネス力は必要、と思うんですけども。

素直にエンジニア力さえあれば、なんとかなるんじゃないかなと思っていますけど。

経済

データサイエンス力とエンジニア力が何で分かれているのか分からないんですけど。

 

実はドカタ作業

ただ結局、机上のデータサイエンスって言われるような難しい作業ってそんなに・・・

例えば、データがあります。これをうまくイジってみて良い結果を出す形で何かの結論を出してください。

っていうのを机上ではやれるんですけど、実際問題使わなきゃいけないデータっていうのがきれいに機械が読み込めるような状態になっていないことが多いんですよね。

落ち穂拾い

結局、正規化と言われるデータをきれいにしてコンピューターが読みやすくする作業っていう割と肉体労働というか落ち穂拾いに近いような。

落穂拾い(おちぼひろい)は、穀物の収穫後に、または収穫に加えるために、田畑に散らばる穂を拾い集めること。

例えば本って出版するときに誤字脱字を一生懸命探す校正さんという仕事があるんですけども。

校正

その校正さんっていう感じで…。

データサイエンティストです!

いろいろなミドルウェア等を使ってエンジニアとしてすごい頑張ります!

めっちゃ給料もらいます!

みたいな話になるんだけど、実際やってみると必要なデータの中で「このデータ使えねーだろ」っていうのを弾く作業だったりするのですよ。

 

もうグチャグチャ…

例えば、全部英語だと思っていたら、その中に1人だけ中国人が混じってたせいで文字コードを中国語で認識してしまって文字化けが大量に起こるとか。

中国語英語

全部英語だと思ってたら実はその中にドイツ人が混じってて、何か変な記号が入っちゃって記号のせいでカンマが読み込めなくなっちゃってデータが壊れちゃうみたいなw

何か予想してないことって結構あったりするんですよね。

普通に住所・名前・電話番号って書いてあると思ったら、住所の欄と電話番号を間違えて書いちゃった人がいて、住所として取り扱っていたらなぜか数字だけの謎の住所が出てきて、

いやいや…これ電話番号だったわ!

みたいなのが来て手作業で入れ替えるみたいな・・・。

エクセル2

他にも名前のふりがながないとか、名前と苗字を逆にしてるとか、男女の性別逆にしてるとか、最近のオシャレ性別みたいなのでか答えたくない、みたいなことになって。

そもそもデータとして性別に答えたくないわ、男として扱うのか女として扱うとか決まってなくて、何か不思議な結果になっちゃったみたいな。

というのがやたらいっぱいあるし世の中って・・・。

 

給料高いからがんばれ

結局プログラムを組んで物事がうまくいくよねっていうのだと思ったら、その前のデータをひたすら見てこのエラーが出たから、絶対このデータが間違っているからこのデータを直すみたいなっていう…。

お金

細かい作業が多いので、なかなか思いどおりに簡単な感じにはならないので。。。

高給をもらえると思いますけど頑張ってください!

-仕事, 社会
-, ,