さとぶろぐ

データサイエンスを中心とした雑記ブログ

  • データ分析
  • 生成AI
  • プロフィール
  • 問い合わせ/お仕事のご依頼

Python

Qiitaの転職記事300本を自然言語処理して転職記事の傾向を調べてみた

2022/5/20  

自然言語処理の技術は最近いろいろな場面で使われていますね。 僕は業務で自然言語を使うことが今までにほとんどなかったので、さすがにちょっと勉強してみないとなと思い、重い腰を上げてタイトルにもあるようにQ ...

Python

Python/Scipyで母比率の信頼区間の計算をしよう(binom)

2022/5/6  

今回は母比率の信頼区間推定をPythonでやってみたいと思います。 これまでに母平均の信頼区間推定の記事を書きましたが、母比率の方もやってみます。   母比率の信頼区間の復習 まずは母比率の ...

Python

Python/Scipyで母平均の信頼区間を計算しよう(母分散:未知)

2022/5/6  

今回は母平均の信頼区間推定(母分散:未知バージョン)をPythonでやってみたいと思います。 前回のこちらの記事では、母分散:既知でやりましたが、今回は未知のパターンになります。   母分散 ...

Python

Python/Scipyで母平均の信頼区間を計算しよう(母分散:既知)

2022/5/6  

今回も統計シリーズで母平均の信頼区間推定をPythonでやってみたいと思います。 Pythonのライブラリの中にScipyという科学計算に強いライブラリがあり、こちらを使うと簡単に区間推定ができます。 ...

Python

Pythonで中心極限定理を可視化してイメージしよう

2022/5/6  

今回は統計で習った中心極限定理をPythonで可視化してイメージしてみたいと思います。 統計学の教科書とかで中心極限定理の定義は習ってざっくりとどんなものかはわかるかもしれませんが、自分で手を動かして ...

Python

【Pandas】aggとgroupbyで列単位で集計関数を適用する

2023/9/13  

Pandasのデータフレームを操作するときに、各列に対して異なる集計関数を適用したいこともありますよね。 でも普通にデータフレームに対してmeanとかMaxなどを適用しても全数値列に対して適用されるだ ...

データ分析

統計検定2級にCBTで合格したのでその勉強法と感想(2022/4)

2022/4/23  

データサイエンティストという肩書で仕事をしているので、さすがに統計検定2級くらい取っておいた方がいいよなぁと思って1年くらい経ちました。 たまに先輩が統計の話をし始めると、ちょっと何言ってるかわからな ...

Python

PySparkでgroupByによる集計処理と統計値の計算

2023/9/13  

今回はPySparkでのgroupByによる集計処理を書いておきます。 集計は本当によくやる処理ですし、PySparkでももれなくSpark DataFrameの処理に使いますから、しっかりやっていき ...

Python

PySparkでデータフレームの結合(join)

2023/9/13  

データフレームの結合処理はPandasでもよくやりますよね。 PySparkでも結合処理は同じようにやることができますので、基本的な結合処理を確認しておきたいと思います。 ただし、僕の独断と偏見で、i ...

Python

PySparkで条件による行の抽出操作〜filter

2025/1/18  

条件による行の抽出操作はデータフレームを扱う時によくやることですよね。 今回はPySparkでSpark DataFrameの行を条件によって抽出する方法を紹介します。   ======== ...

« Prev 1 … 4 5 6 7 8 … 18 Next »
  • Post
  • Share
  • Pocket
  • Hatena
  • LINE
  • URLコピー

管理人の紹介




サトシ


SE→博士→研究者→データサイエンティスト(会社員)→フリーランス → 株式会社Mikage設立

✅ Udemy講師(受講者約2万人)

✅ 企業・自治体様向けのAI活用研修などのお仕事も承っています。こちらの「お問い合わせ/お仕事の依頼」よりお気軽にご連絡ください。
お問い合わせ/お仕事のご依頼

※当ブログではアフィリエイト・Google AdSense等による広告を掲載しています

Udemyでの学習動画

✅オンライン学習プラットフォームUdemyにて学習動画を公開しています。

✅公式LINEやってます!
ご登録はコチラ ▶ https://lin.ee/4gsWB1vJ

✅公式LINE登録者限定特典あり!
1. Udemy全講座のスライドが見れる!
2. Udemy講座を格安で購入できるクーポンをいつでも使える!

<リリース済みコース抜粋>
・Pythonによる時系列分析~機械学習・ディープラーニング編
・Pythonによる異常検知
・PySparkによる大規模データ処理手法と機械学習
・初めての画像分類モデル開発
・SQLによるマーケティングデータ分析
・SnowflakeによるML/AI活用
・Snowflakeによるデータエンジニアリングの基礎
・Google GeminiとGoogle Workspaceによる業務効率化
他、20講座以上

記事の検索

おすすめ記事

1
個別スクール:Pythonによるデータサイエンス・AI開発(基礎編)

このオンライン講座について 概要 本講座は「Pythonによるデータサイエンス/AI開発マスターコース」の基礎編ということで、データサイエンスの様々な基本トピックに取り組みます。データサイエンスと一口 ...

2
個別スクール:Pythonによるデータサイエンス・AI開発(応用編)

このオンライン講座について 概要 本講座は「データサイエンス/AI開発マスターコース」の応用編ということで、統計・機械学習・ディープラーニングの基礎を既に身につけた方が、より複雑なビジネス課題や高度な ...

3
個別スクール:SQLによるデータ分析マスターコース

このオンライン講座について 概要 本講座は「SQLによるデータ分析マスターコース」ということで、ローカル環境でのPostgresQLを使用したデータベース操作に始まり、AWSの代表的なデータ分析サービ ...

Thanks

アイコンは、くぐはらひろさんに描いていただきました。ありがとうございました。

さとぶろぐ

データサイエンスを中心とした雑記ブログ

© 2025 さとぶろぐ