SQL

SQL สำคัญอย่างไรกับอาชีพสาย Data

SQL มันเก่าไปแล้วหรือยัง ?

Edgar F Codd.jpg
Edgar Frank Codd
(1923 – 2003)

A Relational Model of Data for Large Shared Data Banks หรือแบบจำลองที่ใช้ในการจัดการคลังข้อมูลขนาดใหญ่ ถือว่าเป็นผลงานที่มีคุณค่าในวงการ Computer Science ซึ่งถูกคิดค้นโดย Edgar Frank Codd ในปี ค.ศ. 1970 และได้รับความสนใจจาก Larry Ellison ที่ได้นำการคิดค้นของ Codd นี้มาสร้าง Oracle Database ขึ้นเป็นครั้งแรก จากนั้น SQL (Structure Query Language) หรือ Sequel จึงได้ถือกำเนิดขึ้นอย่างเป็นรูปเป็นร่าง

ด้วยเหตุนี้ SQL จึงเริ่มเป็นที่รู้จักตั้งแต่ปี ค.ศ. 1970 ถ้านับดีๆ ก็เกือบ 50 ปีมาแล้ว มันเลยถูกมองว่าเป็นภาษาโบราณ แต่ทำไมยังคงถูกนำมาใช้อย่างแพร่หลาย และถือได้ว่าเป็นเครื่องมือทำมาหากินที่สำคัญของอาชีพสาย Data จนถึงยุคปัจจุบัน ?

1. ข้อมูลมีจำนวนมากขึ้น

ปัจจุบันมีข้อมูลไหลเวียนอยู่บนโลก ประมาณ 2.5 extrabytes (2.5 ล้าน gigabytes) ต่อวัน ตั้งแต่ปี 2018 และมีการคาดเดาว่าจะเพิ่มขึ้นเป็น 463 extrabytes หรือ 463 ล้าน gigabytes ต่อวันในปี 2025 ด้วยอัตราการเติบโตของข้อมูลที่รวดเร็วในทุกๆ อุตสาหกรรม รวมถึงการใช้ข้อมูลร่วมกันในอุตสาหกรรมต่างๆ เช่น Data Science และ Marketing, Data Science และ Healthcare เป็นต้น

การใช้ Relational database เพื่อรองรองรับกิจกรรมเหล่านี้ จะช่วยให้การทำงานกับข้อมูลจำนวนมากได้ดีขึ้น ดังนั้นการใช้ภาษา SQL เพื่อทำการเชื่อมโยงข้อมูลที่หลากหลายจะช่วยให้การทำงานเป็นไปได้อย่างมีประสิทธิภาพมากขึ้น

2. SQL ยังคงเป็นที่ต้องการของตลาด

หลายปีมานี้ มีเทคโนโลยีที่ใช้กับงาน Data เกิดมากมาย เช่น Python , R เป็นต้น แต่เชื่อไหมว่า SQL ยังคงติดอยู่ใน Top 5 skills ของคนสายอาชีพ Data ที่จำเป็นต้องมี อ้างอิงจากเว็บไซต์ Jobdbs เมื่อปลายปี 2019

จากรูปจะเห็นว่า SQL ก็ยังคงเป็นลำดับต้นๆ โดยเฉพาะสำหรับ Data Analyst และ BI เพราะงานเกือบจะทั้งหมดนั้นเป็นการดึงข้อมูลจาก Relational Database เพื่อนำมาทำ Ad-hoc report และ Descriptive dashboard ให้ผู้บริหารนำ insights ที่ได้ไปใช้เพื่อพัฒนาธุรกิจต่อไป

แม้ว่า Trend เรื่อง NoSQL หรือ Document database กำลังมาแรง แต่ก็คงปฏิเสธไม่ได้ว่าบริษัทส่วนใหญ่ยังคงใช้ Relational Database เนื่องจากจัดการกับข้อมูลได้ง่าย และเป็น Standard ที่ใช้กันอย่างแพร่หลาย ลองมาดูบริษัทที่รับสมัครพนักงานโดยที่ต้องมีทักษะ SQL เข้ามาเกี่ยวข้อง

Companies require SQL skills in JobDBs

จะเห็นได้ว่า SQL ยังจำเป็นอยู่ในอุตสาหกรรมในหลายแขนง ไม่ว่าจะเป็น Telco, E-Commerce, Software house, Insurance, Retail, Banking นี่จึงเป็นเหตุผลสำคัญที่คนในสายงาน Data จำเป็นต้องมีความรู้เกี่ยวกับ SQL

จากการสำรวจของ Stack Overflow ของชาว developers ในปี 2020 SQL ยังคงเป็นภาษาที่ได้รับความนิยมมากเป็นอันดับ 3 เลยทีเดียว

ที่มา Stack Overflow

3. SQL เป็นภาษาที่เขียนง่าย

ภาษา programming นั้นมีมากกว่า 250 ภาษา แต่หากใครจะเริ่มเขียนโปรแกรม แนะนำว่า SQL เป็นอีกตัวเลือกที่น่าสนใจ เพราะ syntax ของ SQL เหมือนกับการเขียนภาษาอังกฤษทั่วไป โดย SQL จะทำหน้าที่ในการเรียกดูข้อมูล (Retrive), เปลี่ยนแปลงข้อมูล (Update), เพิ่มข้อมูล (Insert) และอื่นๆ เกี่ยวกับฐานข้อมูล โดยจะเรียกรวมๆ ว่า Query ลองดูตัวอย่างด้านล่าง

Query

SELECT capital, country
FROM world

ลองแปลง่ายๆ แบบคนที่ไม่เคยเขียนโปรแกรม พอจะเดาได้ว่าต้องการจะเลือก เมืองหลวง, ประเทศ จากโลก ลองมาดูผลลัพธ์ที่ได้จาก query นี้

Result

capitalcountry
BangkokThailand
LondonUK
ParisFrance
BeijingChina
MoscowRussia
Results from query

ซึ่งจริงๆ แล้ว หน้าที่ของ SELECT phrase คือ การเลือกคอลัมน์ที่ต้องการดึงข้อมูลออกมาจากฐานข้อมูล ส่วน FROM phrase คือ การกำหนดตารางที่ใช้ดึงข้อมูลออกมา อย่างเช่น Query ด้านบน ทำหน้าที่ดึงคอลัมน์ capital, country ออกมาจากตารางที่ชื่อ world

จาก 3 เหตุผลข้างต้นที่กล่าวมา ก็เพียงพอแล้วที่จะบอกว่า SQL ยังคงสำคัญ และไม่ตายไปจากอาชีพสาย Data ง่ายๆ ทั้งที่มีอายุกว่า 50 ปีแล้ว (แก่กว่าคนเขียนอีก) ดังนั้นหากใครที่คิดจะเดินทางสายนี้ ก็ถือได้ว่า SQL คือประตูสู่โลกของ Data

เราจะเรียน SQL ได้ที่ไหนบ้าง ?

หากใครอ่านบทความนี้แล้ว สนใจศึกษาเรื่อง SQL ตอนนี้บนโลกออนไลน์ก็มีหลายแหล่งความรู้ด้วยกัน เช่น

Datacamp เป็นแพลตฟอร์มเรียนออนไลน์ สำหรับคนที่ทำงานสาย Data ที่แท้จริง มีให้เรียนรู้หลายสกิลไม่ว่าจะเป็น R, Python, SQL รวมถึง Spreadsheet และอื่นๆ อีกมากมาย โดยการสอน SQL จะเป็นลักษณะทฤษฎี + ปฏิบัติ ให้ผู้เรียนได้ Query กันตลอดทุกคอร์ส ทำให้เราคุ้นเคยกับ SQL ได้ง่ายขึ้น แถมยังได้ Completion certificate ด้วย แต่จะมีค่าใช้จ่ายในการเรียน และสอนเป็นภาษาอังกฤษ

DataRockie เป็น website คนไทย มีคอร์สปูพื้นฐาน SQL ให้เรียนฟรี ไม่เสียค่าใช้จ่ายใดๆ และยังมีคอร์ส R, Python, SPSS อีกด้วย รวมถึงบทความเกี่ยวกับ Data ในแง่มุมต่างๆ โดยการสอน SQL จะเป็นลักษณะทฤษฎี + ลองปฏิบัติ + ทำควิซท้ายบท และเนื่องจากสอนเป็นภาษาไทย จึงทำให้คนที่ไม่เคยมีพื้นฐานมาก่อนเข้าใจ SQL ได้ง่ายมากขึ้น

Next step

หากใครที่เคยใช้ SQL ทำงานผ่าน Tools ต่างๆ เช่น SQL server, MySQL, Oracle DB หรือ Tools อื่นๆ ปัจจุบันทาง Google มีผลิตภัณฑ์ที่ชื่อว่า BigQuery เป็นการทำงานกับ Database ผ่าน GCP (Google Cloud Platform) ทำงานผ่าน Web Application ทำให้ users สามารถใช้งานได้ทุกที่ทุกเวลา อีกทั้ง GCP มี infrastructure ต่างๆ เตรียมพร้อมไว้ให้แล้ว เพียงแค่มี Internet ทุกคนก็สามารถใช้งาน BigQuery ได้ง่ายๆ

และในตอนนี้ทางบริษัทมีเปิดรับทีมงานสาย Data Analytics อยู่หลายตำแหน่งเลย ใครกำลังมองหางาน และอยากทำงานกับข้อมูลจากหลากหลายอุตสาหกรรมก็สมัครกันเข้ามานะ 🙂

References

https://www.northeastern.edu/graduate/blog/sql-data-analyst/

https://insights.stackoverflow.com/survey/2020#technology-programming-scripting-and-markup-languages-professional-developers

https://medium.com/@chaiyasitbunnag/อยากเปลี่ยนงานมาสาย Data ต้องมีทักษะและความรู้อะไรบ้าง? หาคำตอบด้วย Web-Scraping

https://365datascience.com/why-learn-sql/