Pandas 1.0 ไลบรารี่พื้นฐานของ python

Pandas ไลบรารี่ด้านวิทยาศาสตร์ข้อมูลยอดนิยมจาก python ที่สุดท้ายมีการเปิดให้ใช้งานเวอร์ชัน 1.0 อย่างเป็นทางการและ pandas 1.0 นี้ยกเลิกการฟังก์ชันการทำงานที่ล้าสมัยแล้วของ python3.6 โดยทำให้มันดีกว่า

Pandas ถูกสร้างขึ้นมาเพื่อให้การทำงานมันง่ายเข้า อยู่ในรูปแบบที่เป็นโครงสร้าง คล้ายๆ กับโต๊ะ, เมทริกซ์หรือข้อมูลอนุกรมเวลา pandas บางทีก็มีการนำ dataframe ของภาษา R มาใช้ และมีการทำงานที่ดีเกี่ยวกับวิทยาศาสตร์ 

ฟีเจอร์ที่สำคัญใน Pandas 1.0

เอกสารของ pandas นี้เราสามารถหาดูได้จากอินเตอร์เน็ต บางครั้งมีการเปลี่ยนชื่อไปหรือมีการจัดโครงสร้างใหม่ เช่นการเทสต์โมดูล ทำให้เกิดการเปลี่ยนแปลงเรื่องโค้ดที่เขียนเล็กน้อย หากว่าคุณเคยใช้ pandas 0.25 เวอร์ชันนั้นจะเป็นเวอร์ชันแรกที่เปิดให้มีการ migrate ข้อมูล มาคราวนี้เป็นเวอร์ชัน 1.0 ที่คุณจะมั่นใจได้ว่าฟังก์ชันการทำงานที่ไม่จำเป็นจะถูกตัดออกไป 

ฟีเจอร์ที่ถูกลบออกจาก Pandas 1.0

เรามาดูกันดีกว่าว่า ฟีเจอร์อะไรบ้างที่ถูกลบออกจาก pandas เวอร์ชันนี้ SparseSeries และ SparseDataFrame โดยที่มาใช้ซีรี่ส์ของ DataFrame ที่มีออพชัน sparsevalues แทนที่

การลงทะเบียน Matplotlib เพื่อไม่ให้โค้ดในส่วนนี้เกิดการชนกันเมื่อคุณติดตั้งโปรแกรม python ในเวอร์ชันอื่นๆ หมายความว่าไลบรารี่นี้จะถูกฝังกับเวอร์ชันใครเวอร์ชันมันนั่นเอง

ซึ่งการติดตั้ง Pandas คุณต้องมั่นใจว่า โค้ดที่เขียนก่อนหน้านี้จะไม่ error เพราะว่าเมื่อติดตั้งไปแล้ว มันจะเปลี่ยนแปลงไม่ได้

pandas เป็นไลบรารี่ที่รวดเร็ว ทรงพลังและใช้งานได้ง่าย มันสามารถใช้โอเพ่นซอร์สในการพัฒนาได้ และมีเครื่องมือในการจัดการมากมายและมันเป็นตัวไลบรารี่ที่ฝังมาตั้งแต่ติดตั้งโปรแกรมภาษา python แล้ว

สำหรับนักพัฒนาโปรแกรมมือใหม่ หากว่าต้องการศึกษาไลบรารี่นี้สามารถ search จาก google ได้เลย จะมีการบรรยายอย่างละเอียดยิบ

ก่อนอื่นก็ต้องดาวน์โหลด pandas เข้ามาเพื่อใช้งานก่อน จากนั้น import package โดยส่วนมากชื่อ alias ของ pandas จะตั้งว่า pd 

มันมีการเข้าถึงข้อมูลในลักษณะของ Dataframe คือมีข้อมูลสองมิติที่เป็น row แล columns ที่เก็บใน type ที่แตกต่างกัน รวมถึง character, integer, floating point values, categorical data คล้ายๆกับ spreadsheet ใน excel และ data frame ในภาษา R ในแต่ละคอลัมน์ของ dataframe เราจะเรียกว่า series 

การผ่านข้อมูลของ pandas เราจะเรียกใช้ function ว่า read_csv  เพื่ออ่านข้อมูลที่เป็น csv file และ pandas จะรองรับไฟล์ format หลายประเภท โดยจะเขียนต่างกัน เช่นหากว่า อ่านไฟล์ json ก็ใช้ฟังก์ชันว่า read_json

ขณะที่ฟังก์ชัน to_ จะเป็นการนำ data ไปเก็บในรูปแบบใด เช่นต้องการเก็บข้อมูลแบบ csv ก็เป็น to_csv หรือเหมือนกับการเขียนไฟล์นั่นเอง library pandas ใช้งานง่ายและเป็นที่นิยมในภาษา python ซึ่งนักเขียน python ต้องรู้อยู่แล้ว

 

สนับสนุนเรื่องราวโดย  เว็บบาคาร่าฝากถอนไม่มีขั้นต่ำ