こんにちは、デジタルボーイです。備忘録がてら、macとLinuxにpipでscikit-learn(sklearn)をインストールするための手順を、まとめておきます。
記事を書いた人
デジタルボーイです。
データサイエンス歴20年以上のおっさんです。中小企業診断士として、データサイエンス、WEBマーケティング、SEOに関するデータ分析、コンサルティングの仕事をしています。自己紹介の詳細はコチラ
お時間のない人のための、結論!!
sklearnのインストールは以下のコマンドで実行できます。
pip install scikit-learn
目次
環境設定
- OS: macOS
- Python: 3.11.0
最新版のsklearnをインストールする手順
普段はsklearn(エス・ケイ・ラーン)と言ったりしますが、正式名称「scikit-learn」となります。正式名称で指定しないとエラーになります。
まず、念のため、pipを最新版にアップデートしておきます
% pip install --upgrade pip
次に、sklearnをインストールします
% pip install scikit-learn
pip show scikit-learn
インストールされたバージョンを確認します。
% pip show scikit-learn
Name: scikit-learn
Version: 1.5.2
Summary: A set of python modules for machine learning and data mining
Home-page: http://scikit-learn.org
Author:
バージョンを指定してsklearnをインストールする手順
もし、特定のバージョンのsklearnをインストールしたい場合は次の手順です。
pip index versions
でインストール可能なバージョンを指定できます
(myenv) % pip index versions scikit-learn
WARNING: pip index is currently an experimental command.
scikit-learn (1.5.2)
Available versions: 1.5.2, 1.5.1, 1.5.0, 1.4.2, 1.4.1.post1, 1.4.0, 1.3.2, 1.3.1, 1.3.0,
1.2.2, 1.2.1, 1.2.0, 1.1.3, 1.1.2, 1.1.1, 1.1.0, 1.0.2, 1.0.1, 1.0, 0.24.2, ...
実際の画面のアウトプットです。
バージョンは==x.x.x
で指定します。
(myenv) % pip install scikit-learn==1.2.2
sklearnの簡単な操作例
簡単に、sklearnの操作例です。
以下は、iris データセットを使用した簡単な分類の例です
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
# irisデータセットをロード
iris = datasets.load_iris()
X = iris.data
y = iris.target
# データを訓練セットとテストセットに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# SVMモデルを作成し、訓練
model = SVC()
model.fit(X_train, y_train)
# テストデータで予測
y_pred = model.predict(X_test)
# 精度を計算
accuracy = accuracy_score(y_test, y_pred)
print(f"モデルの精度: {accuracy:.2f}")
以下のようにアウトプットが出力されればOKです。
まとめ
以上、pipを使ったsklearnのインストール手順でした!