Bahasa Pemrograman yang harus diketahui untuk Data Scientist
Menjadi seorang data scientist tidak diharuskan memiliki latar belakang IT. Dari jaringan yang ikuti di LinkedIn banyak yang alih profesi dari berbagai latar belakang ke data scientist. Dan itu pun wajar, mengingat secara global perusahaan berbondong-bondong menuju industri digital. Di awal januari 2023, mencoba transisi dari desainer ke data science.
Baik, langsung ke topik pembahasan. Berikut ini adalah bahasa pemrograman yang harus diketahui untuk data scientist. Apa saja?
Python
- Website: Python
- Dokumentasi: Python Docs
- Buku: Python Books, Realpython Books
Python yang diciptakan oleh Guido van Rossum merupakan bahasa high-level data struktur programming yang mana sederhana, jelas dan logis, tetapi efektif untuk pemrograman berbasis orientasi (OOP).
Python yang disarankan untuk dipasang minimal versi python3.10 agar
mendapat dukungan sepenuhnya. Python yang merupakan bahasa pemrograman
multi-paradigma juga menawarkan beberapa dukungan pemrograman fungsional
yang mirip lisp, seperti filter, map, reduce, set dan ekspresi
generator.
library yang ditawarkan python juga banyak sekali. Misalnya pandas, numpy, scipy, scikit-learn, matplotlib, seaborn dan masih banyak lagi untuk kebutuhan data science. Anda dapat mencoba python sesuai tautan diatas dan latih kemampuan pemrograman setiap hari.
pythonPython 3.10.9 (main, Dec 6 2022, 18:44:57) [GCC 11.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> print("Hello World")
Hello WorldSQL
- Website: MariaDB
- Dokumentasi: MariaDB Docs
- Buku: MariaDB Books
SQL (Structured Query Language) [baca: sequel] merupakan bahasa pemrograman untuk mengakses data dalam basis data relasional (RDBMS). Hampir semua server basis data menggunakan SQL untuk manajemen data.
Data scientist tentu akan bergulat dengan database, seperti pembuatan database, mengolah, dan menerjemahkan data agar lebih dipahami. Sehingga diperlukan untuk menentukan keputusan stakeholder.
Dalam penggunaan SQL, menggunakan MariaDB (turunan dari MySQL) sebagai manajemen data lebih leluasa untuk dikembangkan secara terbuka dan tidak terikat oleh produk yang berlisensi proprietary (Oracle). MariaDB juga memiliki storage engine yang lebih banyak dari pada MySQL.
sudo mysql -u root -pWelcome to the MariaDB monitor. Commands end with ; or \g.
Your MariaDB connection id is 3
Server version: 10.6.11-MariaDB MariaDB Server
Copyright (c) 2000, 2018, Oracle, MariaDB Corporation Ab and others.
Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.
MariaDB [(none)]> show databases;
+--------------------+
| Database |
+--------------------+
| hervymart |
| hervypraktek |
| information_schema |
| mysql |
| performance_schema |
| sys |
+--------------------+
6 rows in set (0,097 sec)
MariaDB [(none)]>R
- Website: R-Project
- Dokumentasi: Posit Docs
- Buku: R-Project Books
Bahasa pemrograman R lebih dikenal sebagai bahasa pemrograman untuk statistika dan visualisasi grafis. Dibuat oleh Ross Ihaka dan Robert Gentleman di Universitas Auckland, dan sekarang dikembangkan oleh R Development Core Team.
Bahasa R dibawah lisensi GNU GPL telah menjadi standar de facto di antara statistikawan untuk pengembangan perangkat lunak statistika, serta digunakan secara luas untuk pengembangan perangkat lunak statistika dan analisis data.
Penggunaan bahasa R dapat dilakukan dengan Jupyter atau RStudio Posit untuk memudahkan data scientist untuk mengolah data.
RR version 4.2.1 (2022-06-23) -- "Funny-Looking Kid"
Copyright (C) 2022 The R Foundation for Statistical Computing
Platform: x86_64-pc-linux-gnu (64-bit)
R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under certain conditions.
Type 'license()' or 'licence()' for distribution details.
Natural language support but running in an English locale
R is a collaborative project with many contributors.
Type 'contributors()' for more information and
'citation()' on how to cite R or R packages in publications.
Type 'demo()' for some demos, 'help()' for on-line help, or
'help.start()' for an HTML browser interface to help.
Type 'q()' to quit R.
> print("HelloWorld")
[1] "HelloWorld"Julia
- Website: Julia Language
- Dokumentasi: Julia Language Docs
- Buku: Julia Language Books
Bahasa pemrograman Julia adalah salah satu bahasa yang digunakan untuk menganalisis numerik dan visualisasi data secara efisien. Sama halnya dengan Python, Julia termasuk bahasa high-level yang syntaxnya tergolong mudah untuk pemula.
Bisa dibilang Julia adalah kompetitornya Python, sebab performanya jauh lebih cepat dari python. Hal ini dikarenakan Julia dikompil dengan framework LLVM untuk kompilasi JIT, yang sebanding dengan kecepatan bahasa C. Selain itu, julia dapat diintegrasikan dengan VIM, Jupyter, dan Julia VScode. Julia juga terdapat Julia Packages untuk pustaka yang dibutuhkan oleh data scientist dan menariknya julia terdapat FluxML pustaka khusus untuk Machine Learning.
julia _ _ _(_)_ | Documentation: https://docs.julialang.org
(_) | (_) (_) |
_ _ _| |_ __ _ | Type "?" for help, "]?" for Pkg help.
| | | | | | |/ _` | |
| | |_| | | | (_| | | Version 1.8.5 (2023-01-08)
_/ |\__'_|_|_|\__'_| |
|__/ |
julia> print("Hello World")
Hello World
julia>Scala
- Website: Scala Language
- Dokumentasi: Scala Language Docs
- Buku: Scala Language Books
Scala (Scalable language) dimulai pada 2001 oleh Martin Odersky merupakan bahasa pemrograman untuk kebutuhan general, high-level, dan multi paradigma.
Scala, seperti Java juga salah satu bahasa pemrograman yang berorientasi pada objek yang aman juga mendukung pemrograman fungsional. Scala berjalan pada platform Java (Java virtual machine) dan kompatibel dengan yang ada program Java.
object HelloWorld extends App {
println("Hello, World!")
}
Kompilasi:
scalac HelloWorld.scala
Menjalankan binary:
scala HelloWorldHello, World!Kesimpulan
Apapun bahasa yang digunakan, sesuaikan dengan kebutuhan dan kriteria data yang ada agar lebih efektif. Berikut pemrograman sesuai sub-judul dari yang mudah dan umum sehingga mudah untuk dipelajari oleh pemula.
Apa bahasa yang terbaik?
Semua bahasa pemrograman adalah terbaik asalkan sesuai dengan kebutuhan dan spesifikasi, karena setiap bahasa memiliki kelebihan dan kekurangan masing-masing. Bahkan secara pribadi menganjurkan untuk tidak fokus kebahasanya, melainkan memahami konsep dasar algoritma pemrograman terlebih dahulu yang lebih penting.
Info Artikel
Terima kasih
Saya menghargai Anda membaca artikel ini. Jika Anda mempunyai pendapat atau ingin mendiskusikannya, Anda dapat menghubungi saya melalui Email. Jangan ragu untuk terhubung dengan saya di Mastodon atau Bluesky. Dan jaga diri Anda.
Penggunaan
Karya ini dilisensikan di bawah CC BY-NC 4.0.
Kutipan
Kutipan bibtex:
@online{hervyqa_bahas_2023,
author = {Hervy Qurrotul},
title = {Bahasa Pemrograman yang harus diketahui untuk Data Scientist},
date = {2023-02-01},
url = {https://hervyqa.srht.site/id/blog/bahasa-pemrograman-untuk-data-scientist/},
langid = {id}
}
Untuk atribusi, silakan mengutip karya ini sebagai:
Hervy Qurrotul. 2023. “Bahasa Pemrograman yang harus diketahui untuk Data Scientist.” February 01, 2023. https://hervyqa.srht.site/id/blog/bahasa-pemrograman-untuk-data-scientist/.