サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
大そうじへの備え
toukei-lab.com
本記事では、PythonのWebアプリケーションフレームワークを用いてWebアプリを開発していく方法を徹底解説していきます。Pythonに慣れるためにはまず動くものを作ってみることがおすすめです!実際にDjangoでの実装とFlaskでの実装をおこなっていったあと、勉強法についても見ていきましょう! こんにちは! データ分析したりAI開発したりする会社を経営しているウマたん(@statistics1012)です! Pythonというとデータ分析のイメージが強いですが、Pythonでは簡単にWebアプリケーションを開発することができます。 この記事では、そんなPythonで開発するWebアプリについてまとめていきたいと思います!
当サイト【スタビジ】の本記事では、Linuxの独学勉強法とおすすめ学習サイトの紹介していきます!普段Googleで調べものをするくらい程度だと、あまり馴染みのないLinux!サーバーの運用やアプリ開発で必要になってくるので、ぜひマスターしていきましょう! こんにちは!スタビジ編集部です! ITエンジニアになりたての人やITエンジニアを目指す人は「Linux」を勉強したほうが良いと耳にしたことがあると思います。 LinuxはWindowsやMacと同じくOSの一種でサーバー構築やアプリ開発など様々な場面で利用されます。 そんなLinuxですが、普段はWindowやMacのPCを使っている人がほとんどなので、馴染みがなく苦手意識を持っている方が多いです。
ターゲットの指定今回はデータの取得に”yfinance“というライブラリを使います これは”Yahoo!Finance’sAPI”から作られたライブラリで、Yahooファイナンスから株価データを取得することが出来ます! ただ、Yahoo! finance APIは、Yahooの公式のサービスではなくYahooの一般公開されているAPIを使用したオープンソースのツールで個人的な使用のみを目的としてます なので、あくまで勉強のために使うように使い方には注意しましょう! pip install yfinanceライブラリはpipコマンドで簡単にインストール出来ます! では”Yahoo Finance API”を使って株価データを取得していきましょう import pandas as pd import matplotlib.pyplot as plt import numpy as np imp
当サイト【スタビジ】の本記事では、昨今のAIの進化のきっかけになっているGPTシリーズについてまとめていきたいと思います。GPT-1から始まりGPT-2、GPT-3、そしてChatGPTであるGPT-3.5、GPT-4と進化してきました。この進化の軌跡と違いについて解説していきます。 こんにちは! データサイエンティストのウマたん(@statistics1012)です! この記事では最近のAIブームの火付け役になったGPTシリーズについて簡単にまとめていきたいと思います。
当サイト【スタビジ】の本記事では、昨今のAIブームのベースとなっているTransformer(トランスフォーマー)について簡単に解説していきたいと思います!Transformerはディープラーニングの進化をブレークスルーさせた技術なんです こんにちは! データサイエンティストのウマたん(@statistics1012)です! この記事では、昨今話題のAIの進化のきっかけになったTransformer(トランスフォーマー)という手法について解説していきます。 主要なAI用語について一挙にまとめた以下の記事も合わせて要チェックです! 【これだけはおさえておきたい!】ビジネスで役立つAI用語45選まとめ!当サイト【スタビジ】の本記事では、ディープラーニング系/機械学習系/統計学系の3つのカテゴリに分けて重要な用語を説明していきます!...
当サイト【スタビジ】の本記事では、データ活用において非常に重要であるデータマネジメントについてDMBOK(ディンボック)の考え方に沿ってまとめていきます。データマネジメントを疎かにしてしまうと、せっかくのデータも意味をなさなくなりますので必ずおさえておきましょう! こんにちは! 消費財メーカーのデータサイエンティストを経て現在は会社経営をしている、ウマたん(@statistics1012)です! データを扱う仕事をしていると必要になるのがデータマネジメント。 攻めのデータ分析を行うためには、地道な守りのデータマネジメントが非常に重要になってくるのです。
当サイト【スタビジ】の本記事では、アップリフトモデリング(Uplift modeling)について分かりやすく解説していきます!アップリフトモデリングの実用場面や実装方法について見ていきますよ!マーケティングの領域で非常に活躍する分析方法ですので、ぜひ利用してみてください。
当サイト【スタビジ】の本記事では、最強の機械学習ライブラリPyCaretについて徹底的にまとめていきますよ!PyCaretはたった数行でデータの前処理から様々な機械学習手法の精度比較までしてくれる非常に優秀なライブラリ。これを使うことでモデリングにかけていた時間を大幅に短縮することができますよ! こんにちは! 消費財メーカーでデータサイエンティスト・デジタルマーケターをやっているウマたん(@statistics1012)です! 機械学習を簡易的に実装できる素晴らしいライブラリ「PyCaret」!! PyCaretを使えば
まずは、MeCabを使う環境を整えていきましょう! MeCabを使う場合はGoogle colaboratoryを使うのがオススメです。 Google colaboratoryであれば、以下のように記述してあげることでMecabを利用することができます。 !apt install aptitude !aptitude install mecab libmecab-dev mecab-ipadic-utf8 git make curl xz-utils file -y !pip install mecab-python3==0.7Google ColaboratoryとはGoogleが無料で提供してくれているクラウド実行型のJupyter notebook実行環境です。 Googleのアカウントを持ってさえいれば誰でも使用することができ、開発環境を整える必要もなくPythonによる機械学習実
本記事では、データ分析の言語として非常によく使われるPythonとRのどっちを使いべきなのか、何が違うのか、という議論をしていきたいと思います。昔Rを使っていて最近はPythonばっかり使っている人間がPythonとRの違いを徹底比較していきますので是非理解してくださいね! こんにちは! データサイエンティストのウマたん(@statistics1012)です。 元々大学院の研究でRを使っていたのですが、企業に入ってからはPythonを使うことが多くなりました。 やはりアカデミックの場ではRが使われることが多いのですが、実務の場ではより広範な範囲を抑えているPythonを使っているケースが多いです。
本記事では、Googleが新たにリリースしたBERTについてSEO的観点とデータサイエンス的観点で解説し、日本語モデルを使って実際に文章の予測を行っていきます!BERTはPythonで簡単に実装できるんですよー!ぜひ試してみてくださいね! こんにちは! デジタルマーケターやらデータサイエンティストみたいなことを事業会社でやったのち、独立して事業展開しているウマたん(@statistics1012)です! データサイエンティストとしてもブロガーとしても気になるBERT!
当サイト【スタビジ】の本記事では、XgboostやLightGBMに代わる新たな勾配ブースティング手法「Catboost」について徹底的に解説していき最終的にPythonにてMnistの分類モデルを構築していきます。LightGBMやディープラーニングとの精度差はいかに!? こんにちは! 消費財メーカーでデジタルマーケター・データサイエンティストをやっているウマたん(@statistics1012)です! Xgboostに代わる手法としてLightGBMが登場し、さらにCatboostという手法が2017年に登場いたしました。 これらは弱学習器である決定木を勾配ブースティングによりアンサンブル学習した非常に強力な機械学習手法群。 計算負荷もそれほど重くなく非常に高い精度が期待できるため、Kaggleなどのデータ分析コンペや実務シーンなど様々な場面で頻繁に使用されているのです。
当サイト【スタビジ】の本記事では、Kaggleについて解説していきKaggleに挑戦するまでにどのようなことを勉強しておいたらよいのか丁寧に解説していきます。ある程度データサイエンスの土台が出来た後はKaggleに挑戦し、世界各国の猛者と凌ぎを削りましょう! こんにちは! データサイエンティストのウマたん(@statistics1012)です! データサイエンティストの腕試しの場として有名なKaggle!! Kaggleでは、世界中の名だたるデータサイエンティストが常に凌ぎを削っています。
最新記事一覧はこちら もっと深く学びたいならスタビジアカデミー スタビジのコンテンツをさらに深堀りしたコンテンツが動画と一緒に学べるスクールです。 プレミアムプランでは現役データサイエンティストがマンツーマンで伴走させていただきます!ご受講お待ちしております! スタビジアカデミーはこちら 勉強ロードマップ 【Python独学勉強法】Python入門を3ヶ月で習得できる学習ロードマップ当サイト【スタビジ】の本記事では、過去僕自身がPythonを独学を駆使しながら習得した経験をもとにPythonを効率よく勉強する方法を具体的なコード付き実装例と合わせてまとめていきます。Pythonはできることが幅広いので自分のやりたいことを明確にして勉強法を選ぶことが大事です。... 【5分で分かる】機械学習の独学勉強ロードマップを徹底的にまとめていく!当サイト【スタビジ】の本記事では、機械学習の独学勉強ロー
当サイト【スタビジ】の本記事では、Pythonでできることを7つまとめていきます!!Pythonで何ができるのか分からない状況から深い理解にもっていきますよー!実際にPythonでの実装例や勉強方法も取り上げているのでぜひご自分の環境で手を動かして実装してみてくださいね!
当サイト【スタビジ】の本記事では、統計学の重要な土台となる数学を勉強するのにおすすめな本を紹介していきます。線形代数や微積の理解をせずに統計学を勉強しても効率が悪いです。ぜひ数学の知識を最低限つけて統計学の学習にのぞみましょう!
線形回帰・Lasso回帰・Ridge回帰とは 今回比較するのは、通常の線形回帰・Lasso回帰・Ridge回帰です。 簡単に、三つの手法について見ていきましょう! 通常の線形回帰通常の線形回帰は残差\({\bf y}-{\bf X}{\bf \beta}\)が最小になるように\(\beta\)を推定します。 つまり、次の式を最小化するように\(\beta\)を推定します。 \begin{eqnarray*} \|{\bf y}-{\bf X}{\bf \beta}\|_2^2\\ \end{eqnarray*} Ridge回帰 Ridge回帰は正則化手法であり、多重共線性などが起きていて通常の線形回帰ではパラメータが推定できないような場面でも罰則を与えることで推定できるようにしたものです。 次の式を最小化するように\(\beta\)を推定します。 \begin{eqnarray*} \|{
k近傍法とはデータを分類する時に活躍する手法です。 ある未知データが与えられたとき、周りの学習データのクラスからその未知データの分類を決定するもの。 そしてkとは手法に与えるパラメーターで、近くに存在する学習データのクラス数を示しています。 たとえば、このような状況では k=3なので未知データの周りの3つのデータを判断材料とします。 実際に見てみると、青〇のクラスが2つ、緑△のクラスが1つなので、未知データは青〇と判断されます。 続いてこのkを5にするとどうなるでしょう? k=5なので周りの5個を判断材料とします。 実際に見てみると、青〇のクラスが2つ、緑△のクラスが3つなので、未知データは緑△と判断されます。 kの値を変えることで分類されるクラスが変わりましたね! 今回挙げた例は非常に分類が難しい例であり、このような場合はそれほど多くありませんがkの値によって分類されるクラスが変わる可能
当サイト【スタビジ】の本記事では、デジタルマーケティングを学ぶ上でオススメの書籍をまとめていきます!デジタルマーケティングとはいえテクノロジーよりの本とマーケ概論よりの本があります。どちらも理解してこそ真のデジタルマーケターと言えるでしょう!
当サイト【スタビジ】の本記事では、レコメンドに用いられる4つのアルゴリズムについて数式は使わずに簡単に解説していきます。レコメンドはどこに向かうのかみたいな議論もしていきたいと思います。果たして完璧なレコメンドはあり得るのでしょうか? こんにちは! デジタルマーケター権データサイエンティストのウマたん(@statistics1012)です! ECサイトを眺めていると、あなたにオススメの商品はこちら!とレコメンドされることってありますよね。 そして、そのレコメンドにまんまとはまって思わぬ商品を購入してしまったり、もしくは全然興味のない商品をレコメンドされてウザいと思ったり。 「俺の何を分かってねん!」とPC画面に叫んでる人もいるかもしれませんが、そんなレコメンドには企業努力の結晶が詰まっているんです。
当サイト【スタビジ】の本記事では、入門者向けに機械学習のアルゴリズム・手法についてカンタンにまとめていきます。RやPythonによる実装も同時に行うので概要の理解と手を動かしながらの実装の理解を同時にしていきましょう! こんにちは! データサイエンティストのウマたん(@statistics1012)です! AIやビッグデータ、機械学習という言葉が巷を賑わせていますが、実際に機械学習とは何かご存知でしょうか?
当サイト【スタビジ】の本記事では、統計モデリングに重要なプログラミング言語「Stan」の勉強法について見ていきます!PythonとRと同時に勉強することでStanによる複雑なモデリングをカンタンに実装することができますよー! こんにちは! データサイエンティストのウマたん(@statistics1012)です! 大学院時代は統計学を専攻しており、ベイズ統計学などの研究をおこなっていました。 ベイズ統計学を実装する時に非常に便利なのが、Stan。 普段解析を行う時はRやPythonで良いのですが、ベイズで複雑なモデリングを行うとなるとStanの出番になるんです。 この記事では、どんな時にStanが必要なのか、Stanの勉強方法とオススメ本についてまとめていきたいと思います。
XGboostは「eXtreme Gradient Boosting」の略で2014年に発表された手法です。 勾配ブースティングと呼ばれるアンサンブル学習と決定木を組み合わせた手法で非常に高い汎化能力を誇ります。 アンサンブル学習とは、弱学習器(それほど性能の高くない手法)を複数用いて総合的に結果を出力する方法で、バギングとブースティングというタイプがあります。 バギングは弱学習器を並列に使うイメージ。決定木とバギングを組み合わせたのがランダムフォレストです。 ランダムフォレストの簡単なイメージが以下 並列に決定木モデルを扱ってそれぞれのモデルの結果を総合的に判断します。 一方でブースティングは弱学習器を直列に使います。 ブースティングと決定木を組み合わせたのがXGboostなのです。 最初の学習器で上手く分類・推定できなかった部分に対して重みを付けて次の弱学習器で学習を行います。 そうす
当サイト【スタビジ】の本記事では、形態素解析器であるMeCabとPythonを用いて形態素解析を行いその後Tf-idfとCos類似度を使い最終的に文章の類似度を算出していきます。また、文章の著者が誰なのかをMeCabとLight gbmを用いて予測していきます。
当サイト【スタビジ】の本記事では、Pythonの軽量WebアプリケーションフレームワークであるFlaskでできることを適宜確認しながら実際に簡単なWebアプリケーションの実例を作成していきたいと思います。Pythonを開発言語としても使えるようになると、幅が広がりますよー! こんにちは! データサイエンティストでありながら最近はWeb開発に没頭しているウマたん(@statistics1012)です。 Webブラウザで動くアプリケーションのことをWebアプリケーションと呼びます! アプリケーションと言えば、スマホのネイティブアプリのイメージが強いかもしれませんがWebブラウザで動くWebアプリケーションも負けていません! そして、そんなWebアプリケーションであればPython・Javascript・HTML・CSSを使って簡単に作ることが可能です! Pythonは普段データ解析用の言語とし
当サイト【スタビジ】の本記事では、過去僕自身がPythonを独学を駆使しながら習得した経験をもとにPythonを効率よく勉強する方法を具体的なコード付き実装例とあわせてまとめていきます。Pythonはできることが幅広いので自分のやりたいことを明確にして勉強法を選ぶことが大事です。 こんにちは! 事業会社でのデータサイエンティストを経て現在は会社経営をしているウマたん(@statistics1012)です。 今では毎日何時間もPythonを触ってる僕ですが、Pythonを勉強しようとして結局投げ出してしまった過去もあります。 プログラミング学習って特に初心者は学び方を間違えるとなかなか続かず挫折してしまうんですよね・・・ この記事では、そんな僕が圧倒的にオススメするPythonの勉強ロードマップやオススメサービス・教材を徹底的に解説していきます! 数あるサービスを使ってきましたが、Pytho
当サイト【スタビジ】の本記事では、データサイエンティストに求められるスキルとそれを身に付けるための勉強法について徹底的にまとめていきます!入門者でも、しっかりデータサイエンティストについて理解し、ある程度独学で駆け出しの状態までいけることを目指します。 事業会社でのデータサイエンティストを経て現在は独立した様々な企業の分析案件を請け負っている、ウマたん(@statistics1012)です。 マーケ・ビジネスサイドとデータサイエンスサイドがグッと近くなる未来を夢見ています。 この記事ではそんな僕が、
当サイト【スタビジ】の本記事では、統計学の世界でよくきくパラメトリックモデルとノンパラメトリックモデルの違いについて解説していきます。統計モデリングの世界へとつながっていくので統計学を学ぶ人にはぜひおさえておいて欲しい概念です。
当サイト【スタビジ】の本記事では、データサイエンスの領域の機械学習と統計学の違いについて考察していきます。定義と境界が曖昧な2つの領域ですが、目的の違いを理解しておくことが大事。機械学習は予測精度を上げることを目的とし統計学はデータ構造の把握をすることを目的とします。 こんにちは! データサイエンティストのウマたん(@statistics1012)です! 大学院時代は統計学専攻で、伝統的な統計学から割と最近の機械学習まで扱っていました。 みなさんは、機械学習と聞くとどんなイメージを持ちますか?
次のページ
このページを最初にブックマークしてみませんか?
『スタビジ|ビジネスに活かせるデータサイエンス(Statistics&business)を発信するメ...』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く