import numpy as np import pandas import seaborn import scipy.stats as st import matplotlib.pyplot as plt import statsmodels.api as sm import statsmodels.formula.api as smf ## Đọc dữ liệu data = pandas.read_csv('ool.csv', low_memory=False) #Chuyển sang giá trị số data['W1_P17A'] = pandas.to_numeric(data['W1_P17A'], errors='coerce') data['PPHHSIZE'] = pandas.to_numeric(data['PPHHSIZE'], errors='coerce') # Phân tích mô hình hồi quy tuyến tính print("Phân tích hồi quy cho 2 biến định lượng") reg1 = smf.ols('PPHHSIZE ~ W1_P17A', data=data).fit() print (reg1.summary()) # Vẽ đồ thị phân tích scat1 = seaborn.regplot(x="W1_P17A", y="PPHHSIZE", data=data) plt.xlabel('Số lượng con ruột hay con nuôi của một gia đình') plt.ylabel('Quy mô hộ gia đình') plt.title('Biểu đồ liên hệ giữa việc quy mô hô gia đình có được quyết đinh bởi số lượng con cái') plt.show()