সেট
গণিত এর সেট কে অনুসরণ করে পাইথন ল্যাংগুয়েজ এর সেট ডাটা স্ট্রাকচার গঠন করা হয়েছে। এটি কোন ইনডেক্স এবং অর্ডার বা ক্রম অনুসরণ করে না।
পাইথনে লিস্ট এবং টাপল এর মতই আরেকটি ডাটা স্ট্রাকচার হচ্ছে সেট(set). পার্থক্য শুধু আপনি চাইলে টাপল এবং লিস্ট এর মধ্যে ডুপ্লিকেট ভ্যালু রাখতে পারবেন কিন্তু সেট এ কোনো ডুপ্লিকেট ভ্যালু রাখতে পারবেন না। আর টাপল এবং লিস্ট এর ভ্যালু গুলো index আকারে সাজানো থাকে কিন্তু সেট এর ভ্যালু গুলো indexing আকারে থাকেনা বা indexing করা যায় না। সেটি অবশ্য প্রয়োজন পরে না , কারণ সেট এর প্রত্যেকটি ভ্যালু ই ইউনিক।
মূলতঃ গাণিতিক কাজ যেমন union, intersection এবং symmetric difference ইত্যাদি বের করার জন্য Set ব্যবহৃত হয়।
সেট তৈরি করা
সমস্ত আইটেম (উপাদান)কে curly braces {} -এর ভিতরে রেখে [ আইটেমগুলোকে কমা দ্বারা আলাদা করে] একটি সেট তৈরি করা হয়,অথবা বিল্ট-ইন set() ফাংশন ব্যবহার করেও সেট তৈরি করা যায় ।
এতে যে কোনো সংখ্যক আইটেম থাকতে পারে এবং সেগুলি বিভিন্ন ধরনের ডাটা টাইপের হতে পারে (ইন্টিজার , স্ট্রিং , ফ্লোট , বুলিয়ান , টাপল )। কিন্তু একটি সেটের আইটেম হিসাবে কিন্তু পরিবর্তনযোগ্য ( mutable ) ডাটা টাইপ যেমন – সেট , লিস্ট কিংবা ডিকশনারি নিতে পারবো না
curly braces {} দিয়ে সেট তৈরী করা
# শুধু ইন্টিজার দিয়ে সেট তৈরী করা
# বিভিন্ন রকম ডাটাটাইপ দিয়ে সেট তৈরী করা
a_set = {3.1416, “vivasoft”, (10,29,40)}
{‘vivasoft’, (10, 29, 40), 3.1416}
কিন্তু যদি লিস্ট দিয়ে যদি সেট তৈরী করতে যাই , এরর পাবো
a_set = {10,20,[‘a’,‘b’]}
Traceback (most recent call last):
File “/home/vivasoft/Desktop/sets/main.py“, line 1, in <module>
a_set = {10,20,[‘a’,’b’]}
TypeError: unhashable type: ‘list’
বিল্ট-ইন set() ফাংশন দিয়ে সেট তৈরী করা
এই ফাংশনটি আসলে আমরা ব্যবহার করি লিস্ট থেকে সেট এ রূপান্তর করার জন্য , set() ফাংশনটি আর্গুমেন্ট হিসেবে একটিই লিস্ট নিবে , এবং লিস্টের প্রতিটি আইটেম কে সেট-এর আইটেম হিসেবে তৈরী করে
ফাঁকা / খালি / empty সেট তৈরী করা আসলে একটু কনফিউজিং হয়ে দাঁড়ায় মাঝে মাঝে। আমরা {} দিয়ে ফাঁকা সেট তৈরী করতে পারবো না। কারণ {} দিয়ে আমরা ডিকশনারি তৈরী করি. তাহলে ফাঁকা সেট তৈরী করার জন্য , আমরা set() ফাংশনটি ব্যবহার করতে পারি
সেটের আইটেম অ্যাক্সেস
যেহেতু সেটে কোন তথ্য orderly সাজানো থাকে না বা কোন ইনডেক্স থাকেনা তাই একটি নির্দিষ্ট উপাদানকে index অনুসারে অ্যাক্সেস করা যায়না।
my_set = {“pen”, “laptop”, “cellphone”}
## {“pen”, “laptop”, “cellphone”}
## (most recent call last):
## File “<stdin>”, line 1, in <module>
## TypeError: ‘set’ object does not support indexing
এখানে প্রোগ্রাম এর আউটপুট আমরা TypeError পাচ্ছি । আসলে, সেটের উপাদানগুলোকে ইনডেক্স নম্বর দিয়ে অ্যাক্সেস করা যায় না। তবে আমরা in অপারেটরের মাধ্যমে কোন উপাদান কোন সেটে আছে কিনা সেটা যাচাই করতে পারি। ফলাফল হিসেবে True অথবা False পাওয়া যায়।
my_set = {“pen”, “laptop”, “cellphone”}
তবে আমাদের লুপের মাধ্যমে সেটের প্রতিটি উপাদানকে অ্যাক্সেস করতে হবে
my_set = {“pen”, “laptop”, “cellphone”}
সেট মেথডস (Set Methods)
অন্যান্য ডাটাটাইপের মত সেটের জন্যও ফিক্সড কিছু method আছে। নিচে এগুলো আলোচনা করা হল ।
সেটে নতুন উপাদান যুক্ত করা
সেটে নতুন একটি উপাদান যোগ করার জন্য এই add() মেথডটি ব্যবহার করা হয়।
my_set = {“pen”, “laptop”, “cellphone”}
## {‘laptop’, ‘pen’, ‘cellphone’}
## {‘laptop’, ‘pen’, ‘cellphone’, ‘cat’}
একসাথে অনেক গুলো উপাদান যোগ করার ক্ষেত্রে add() ফাংশন কাজ করে না। তখন আমাদের update() ফাংশন ব্যবহার করতে হবে। এই ফাংশনের ভিতর অনেকগুলো ভ্যালু দিলেই তা অ্যাড হয়ে যাবে।
my_set = {“pen”, “laptop”, “cellphone”}
## {‘laptop’, ‘pen’, ‘cellphone’}
my_set.update(“dog”, “egg”)
# {‘laptop’, ‘pen’, ‘cellphone’, ‘e’, ‘d’, ‘g’, ‘o’, ‘cat’}
আমরা একবার নরমালি দুইটা এলিমেন্ট পাস করেছিলাম। কিন্তু তখন জিনিসগুলা ক্যারেক্টার হিসাবে ভাগ হয়ে সেটে অ্যাড হয়েছে। আমরা যেভাবে দিয়েছি সেভাবে অ্যাড করার জন্য এলিমেন্টগুলোকে {} চিহ্নের ভিতরে পাঠাতে হবে।
my_set = {“pen”, “laptop”, “cellphone”}
## {‘laptop’, ‘pen’, ‘cellphone’}
my_set.update({“dog”, “egg”})
## {‘laptop’, ‘dog’, ‘pen’, ‘egg’, ‘cellphone’}
discard() and remove() ফাংশন
এই discard () মেথডটি সেটে বিদ্যমান কোন উপাদান মুছে ফেলে।
my_set = {“pen”, “laptop”, “cellphone”}
## {‘laptop’, ‘pen’, ‘cellphone’}
## {‘laptop’, ‘cellphone’}
remove() মেথডটি সেটে বিদ্যমান কোন একটি উপাদানকে মুছে ফেলার জন্য ব্যবহার করা হয়। এটি discard() এর মতই, তবে যদি কোন উপাদান সেটে না থাকে, সেই উপদানকে discard() করতে গেলে কোন এরর দেয়না কিন্তু remove() মেথড দেয়।
my_set = {“pen”, “laptop”, “cellphone”}
## {‘laptop’, ‘pen’, ‘cellphone’} my_set.remove(‘pen’)
print(my_set) ## {‘laptop’, ‘cellphone’}
## Traceback (most recent call last):
## File “<stdin>”, line 1, in <module>
যদি আমরা আমাদের সেটের সব এলিমেন্টকে একটা স্টেটমেন্ট দিয়েই মুছে ফেলতে চাই, তখন আমরা clear() মেথডটি ব্যবহার করব।
my_set = {“pen”, “laptop”, “cellphone”}
## {‘laptop’, ‘pen’, ‘cellphone’}
সেট Length
একটা সেটে ঠিক কতগুলো আইটেম রয়েছে তা জানার জন্য আমরা len() ফাংশনটা ব্যবহার করতে পারি। একটা উদাহরণ দেখা যাক:
ইউনিয়ন
দুইটি সেটের union করার অর্থ এমন যে, একটা নতুন সেট গঠন করা হবে সেখানে দুইটি সেটের সকল উপাদান থাকবে।
ধরা যাক,
X = {1, 2, 3, 4, 5}
Y = {6, 7, 8}
X এবং Y দুইটা সেট হলে, তাদের ইউনিয়ন সেট C = (X U Y) = {1, 2, 3, 4, 5, 6, 7, 8}
এই একই কাজ union() ফাংশন ব্যবহার করে পাইথন এ করা যায় । উদাহরণ:
## {1, 2, 3, 4, 5, 6, 7, 8}
X আর Y দুইটা সেট। প্রোগ্রাম টি তে শেষ লাইনের মাধ্যমে আমরা পরিবর্তিত সেট তৈরী করেছি, যেটি এই দুটি সেটের ইউনিয়ন
ইন্টারসেকশন
দুইটি সেটের intersection করার অর্থ এমন যে, একটা নতুন সেট গঠন করা হবে সেখানে শুধুমাত্র দুইটি সেটের কমন উপাদানগুলো থাকবে।
ধরা যাক,
## A এবং B দুইটা সেট হলে, তাদের ইন্টারসেকশন সেট
এই একই কাজ intersection() ফাংশন ব্যবহার করে পাইথন এ করা যায় । উদাহরণ:
X আর Y দুইটা সেট। প্রোগ্রাম টি তে শেষ লাইনের মাধ্যমে আমরা পরিবর্তিত সেট তৈরী করেছি, যেটি এই দুটি সেটের ইন্টারসেকশন
ডিফারেন্স
ধরি, X ও Y দুইটা সেট আছে।এখন আমরা X – Y বের করব। নতুন যে সেটটা তৈরি হবে সেখানে Y সেটের কোন উপাদান । আবার B – A এর ক্ষেত্রে A সেটের কোন উপাদান থাকতে পারবে না।
## X এবং Y দুইটা সেট হলে, তাদের ইউনিয়ন সেট
C = (X – Y) = {1, 2, 3, 4}
পাইথন দিয়ে X – Y বের করার জন্য difference() ফাংশন ব্যবহার করতে হবে: