Overview

Dataset statistics

Number of variables4
Number of observations393
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory12.4 KiB
Average record size in memory32.3 B

Variable types

Numeric2
Categorical2

Alerts

ชื่องานบริการ has a high cardinality: 182 distinct values High cardinality

Reproduction

Analysis started2025-04-17 06:20:02.251299
Analysis finished2025-04-17 06:20:04.783742
Duration2.53 seconds
Software versionpandas-profiling v3.1.0
Download configurationconfig.json

Variables

Distinct9
Distinct (%)2.3%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean2565.391858
Minimum2559
Maximum2567
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size3.2 KiB
2025-04-17T13:20:04.865710image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/

Quantile statistics

Minimum2559
5-th percentile2562
Q12564
median2566
Q32567
95-th percentile2567
Maximum2567
Range8
Interquartile range (IQR)3

Descriptive statistics

Standard deviation1.826431465
Coefficient of variation (CV)0.0007119502855
Kurtosis0.5917989727
Mean2565.391858
Median Absolute Deviation (MAD)1
Skewness-1.13496553
Sum1008199
Variance3.335851898
MonotonicityIncreasing
2025-04-17T13:20:04.993070image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/
Histogram with fixed size bins (bins=9)
ValueCountFrequency (%)
2567152
38.7%
256682
20.9%
256553
 
13.5%
256442
 
10.7%
256327
 
6.9%
256220
 
5.1%
256111
 
2.8%
25604
 
1.0%
25592
 
0.5%
ValueCountFrequency (%)
25592
 
0.5%
25604
 
1.0%
256111
 
2.8%
256220
 
5.1%
256327
 
6.9%
256442
 
10.7%
256553
 
13.5%
256682
20.9%
2567152
38.7%
ValueCountFrequency (%)
2567152
38.7%
256682
20.9%
256553
 
13.5%
256442
 
10.7%
256327
 
6.9%
256220
 
5.1%
256111
 
2.8%
25604
 
1.0%
25592
 
0.5%
Distinct34
Distinct (%)8.7%
Missing0
Missing (%)0.0%
Memory size3.2 KiB
กรมสนับสนุนบริการสุขภาพ
125 
กรมปศุสัตว์
46 
กรุงเทพมหานคร
43 
องค์กรปกครองส่วนท้องถิ่นและองค์กรปกครองพิเศษ
22 
กรมสรรพสามิต
18 
Other values (29)
139 

Length

Max length77
Median length23
Mean length23.09669211
Min length10

Characters and Unicode

Total characters0
Distinct characters0
Distinct categories0 ?
Distinct scripts0 ?
Distinct blocks0 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique6 ?
Unique (%)1.5%

Sample

1st rowสํานักงานประกันสังคม
2nd rowสํานักงานประกันสังคม
3rd rowสํานักงานประกันสังคม
4th rowกรมสรรพากร
5th rowสํานักงานประกันสังคม

Common Values

ValueCountFrequency (%)
กรมสนับสนุนบริการสุขภาพ125
31.8%
กรมปศุสัตว์46
 
11.7%
กรุงเทพมหานคร43
 
10.9%
องค์กรปกครองส่วนท้องถิ่นและองค์กรปกครองพิเศษ22
 
5.6%
กรมสรรพสามิต18
 
4.6%
สํานักงานประกันสังคม18
 
4.6%
สำนักงานคณะกรรมการคุ้มครองผู้บริโภค10
 
2.5%
กรมวิชาการเกษตร10
 
2.5%
สำนักงานมาตรฐานสินค้าเกษตรและอาหารแห่งชาติ9
 
2.3%
กรมพัฒนาธุรกิจการค้า8
 
2.0%
Other values (24)84
21.4%

Length

2025-04-17T13:20:05.170642image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
กรมสนับสนุนบริการสุขภาพ125
29.3%
กรมปศุสัตว์46
 
10.8%
กรุงเทพมหานคร45
 
10.5%
องค์กรปกครองส่วนท้องถิ่นและองค์กรปกครองพิเศษ22
 
5.2%
กรมสรรพสามิต18
 
4.2%
สํานักงานประกันสังคม18
 
4.2%
สำนักงานคณะกรรมการคุ้มครองผู้บริโภค10
 
2.3%
กรมวิชาการเกษตร10
 
2.3%
สำนักงานมาตรฐานสินค้าเกษตรและอาหารแห่งชาติ9
 
2.1%
กิจการโทรทัศน์8
 
1.9%
Other values (31)116
27.2%

Most occurring characters

ValueCountFrequency (%)
No values found.

Most occurring categories

ValueCountFrequency (%)
No values found.

Most frequent character per category

Most occurring scripts

ValueCountFrequency (%)
No values found.

Most frequent character per script

Most occurring blocks

ValueCountFrequency (%)
No values found.

Most frequent character per block

ชื่องานบริการ
Categorical

HIGH CARDINALITY

Distinct182
Distinct (%)46.3%
Missing0
Missing (%)0.0%
Memory size3.2 KiB
แบบขึ้นทะเบียนนายจ้างและขึ้นทะเบียนผู้ประกันตน (สปส.1-01)
 
10
ขึ้นทะเบียนผู้ประกันตน (สปส. 1-03)
 
10
ขอใบอนุญาตขายสุรา
 
7
ขอจดทะเบียนการประกอบธุรกิจตลาดแบบตรง
 
7
ขอใบอนุญาตขายยาสูบ
 
7
Other values (177)
352 

Length

Max length208
Median length53
Mean length55.35368957
Min length9

Characters and Unicode

Total characters0
Distinct characters0
Distinct categories0 ?
Distinct scripts0 ?
Distinct blocks0 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique97 ?
Unique (%)24.7%

Sample

1st rowแบบขึ้นทะเบียนนายจ้างและขึ้นทะเบียนผู้ประกันตน (สปส.1-01)
2nd rowขึ้นทะเบียนผู้ประกันตน (สปส. 1-03)
3rd rowแบบขึ้นทะเบียนนายจ้างและขึ้นทะเบียนผู้ประกันตน (สปส.1-01)
4th rowแบบฟอร์มขอจดทะเบียนภาษีมูลค่าเพิ่ม
5th rowขึ้นทะเบียนผู้ประกันตน (สปส. 1-03)

Common Values

ValueCountFrequency (%)
แบบขึ้นทะเบียนนายจ้างและขึ้นทะเบียนผู้ประกันตน (สปส.1-01)10
 
2.5%
ขึ้นทะเบียนผู้ประกันตน (สปส. 1-03)10
 
2.5%
ขอใบอนุญาตขายสุรา7
 
1.8%
ขอจดทะเบียนการประกอบธุรกิจตลาดแบบตรง7
 
1.8%
ขอใบอนุญาตขายยาสูบ7
 
1.8%
ขอใบอนุญาตจัดตั้งสถานที่ จำหน่ายหรือสะสมอาหาร (เกิน 200 ตร.ม.)7
 
1.8%
ขอหนังสือรับรองการแจ้งจัดตั้งสถานที่ จำหน่ายหรือสะสมอาหาร (ไม่เกิน 200 ตร.ม.)7
 
1.8%
แบบฟอร์มขอจดทะเบียนภาษีมูลค่าเพิ่ม6
 
1.5%
ขอยื่นแบบแสดงรายการภาษีป้าย6
 
1.5%
ขอใบอนุญาตให้ตั้งสถานพยาบาลสัตว์ (ต้องได้รับหนังสืออนุมัติแผนการจัดตั้งสถานพยาบาลสัตว์ก่อน)5
 
1.3%
Other values (172)321
81.7%

Length

2025-04-17T13:20:05.369008image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
คลินิก34
 
4.0%
การสมัครสอบใบอนุญาตการขึ้นทะเบียนผู้ประกอบโรคศิลปะ24
 
2.8%
ตร.ม22
 
2.6%
จำหน่ายหรือสะสมอาหาร22
 
2.6%
20022
 
2.6%
19
 
2.2%
การขอใบอนุญาตการขึ้นทะเบียนผู้ประกอบโรคศิลปะ17
 
2.0%
gap15
 
1.7%
ดัดแปลงอาคาร13
 
1.5%
โรงพยาบาล13
 
1.5%
Other values (216)657
76.6%

Most occurring characters

ValueCountFrequency (%)
No values found.

Most occurring categories

ValueCountFrequency (%)
No values found.

Most frequent character per category

Most occurring scripts

ValueCountFrequency (%)
No values found.

Most frequent character per script

Most occurring blocks

ValueCountFrequency (%)
No values found.

Most frequent character per block

จำนวนคำขอ
Real number (ℝ≥0)

Distinct131
Distinct (%)33.3%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean190.3231552
Minimum1
Maximum22159
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size3.2 KiB
2025-04-17T13:20:05.561062image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile1
Q11
median7
Q345
95-th percentile550.8
Maximum22159
Range22158
Interquartile range (IQR)44

Descriptive statistics

Standard deviation1293.030566
Coefficient of variation (CV)6.793868907
Kurtosis225.0796942
Mean190.3231552
Median Absolute Deviation (MAD)6
Skewness14.18593797
Sum74797
Variance1671928.046
MonotonicityNot monotonic
2025-04-17T13:20:05.886103image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1108
27.5%
233
 
8.4%
517
 
4.3%
314
 
3.6%
411
 
2.8%
711
 
2.8%
811
 
2.8%
69
 
2.3%
109
 
2.3%
116
 
1.5%
Other values (121)164
41.7%
ValueCountFrequency (%)
1108
27.5%
233
 
8.4%
314
 
3.6%
411
 
2.8%
517
 
4.3%
69
 
2.3%
711
 
2.8%
811
 
2.8%
95
 
1.3%
109
 
2.3%
ValueCountFrequency (%)
221591
0.3%
107291
0.3%
55631
0.3%
21271
0.3%
20891
0.3%
20431
0.3%
19371
0.3%
18331
0.3%
14221
0.3%
10681
0.3%

Interactions

2025-04-17T13:20:04.021315image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/
2025-04-17T13:20:03.574777image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/
2025-04-17T13:20:04.188343image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/
2025-04-17T13:20:03.858186image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/

Correlations

2025-04-17T13:20:06.024189image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/

Spearman's ρ

The Spearman's rank correlation coefficient (ρ) is a measure of monotonic correlation between two variables, and is therefore better in catching nonlinear monotonic correlations than Pearson's r. It's value lies between -1 and +1, -1 indicating total negative monotonic correlation, 0 indicating no monotonic correlation and 1 indicating total positive monotonic correlation.

To calculate ρ for two variables X and Y, one divides the covariance of the rank variables of X and Y by the product of their standard deviations.
2025-04-17T13:20:06.206801image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/

Pearson's r

The Pearson's correlation coefficient (r) is a measure of linear correlation between two variables. It's value lies between -1 and +1, -1 indicating total negative linear correlation, 0 indicating no linear correlation and 1 indicating total positive linear correlation. Furthermore, r is invariant under separate changes in location and scale of the two variables, implying that for a linear function the angle to the x-axis does not affect r.

To calculate r for two variables X and Y, one divides the covariance of X and Y by the product of their standard deviations.
2025-04-17T13:20:06.367760image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/

Kendall's τ

Similarly to Spearman's rank correlation coefficient, the Kendall rank correlation coefficient (τ) measures ordinal association between two variables. It's value lies between -1 and +1, -1 indicating total negative correlation, 0 indicating no correlation and 1 indicating total positive correlation.

To calculate τ for two variables X and Y, one determines the number of concordant and discordant pairs of observations. τ is given by the number of concordant pairs minus the discordant pairs divided by the total number of pairs.
2025-04-17T13:20:06.534481image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/

Phik (φk)

Phik (φk) is a new and practical correlation coefficient that works consistently between categorical, ordinal and interval variables, captures non-linear dependency and reverts to the Pearson correlation coefficient in case of a bivariate normal input distribution. There is extensive documentation available here.

Missing values

2025-04-17T13:20:04.423100image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/
A simple visualization of nullity by column.
2025-04-17T13:20:04.613723image/svg+xmlMatplotlib v3.3.4, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

First rows

ปีงบประมาณ พ.ศ.ชื่อหน่วยงานชื่องานบริการจำนวนคำขอ
02559สํานักงานประกันสังคมแบบขึ้นทะเบียนนายจ้างและขึ้นทะเบียนผู้ประกันตน (สปส.1-01)7
12559สํานักงานประกันสังคมขึ้นทะเบียนผู้ประกันตน (สปส. 1-03)1
22560สํานักงานประกันสังคมแบบขึ้นทะเบียนนายจ้างและขึ้นทะเบียนผู้ประกันตน (สปส.1-01)11
32560กรมสรรพากรแบบฟอร์มขอจดทะเบียนภาษีมูลค่าเพิ่ม10
42560สํานักงานประกันสังคมขึ้นทะเบียนผู้ประกันตน (สปส. 1-03)5
52560บริษัท ทีโอที จำกัด (มหาชน) (ส่วนกลาง)ขอใช้บริการโทรศัพท์พื้นฐาน และอินเทอร์เน็ต1
62561สํานักงานประกันสังคมแบบขึ้นทะเบียนนายจ้างและขึ้นทะเบียนผู้ประกันตน (สปส.1-01)41
72561สํานักงานประกันสังคมขึ้นทะเบียนผู้ประกันตน (สปส. 1-03)20
82561กรมสรรพากรแบบฟอร์มขอจดทะเบียนภาษีมูลค่าเพิ่ม12
92561สำนักงานคณะกรรมการคุ้มครองผู้บริโภคขอจดทะเบียนการประกอบธุรกิจตลาดแบบตรง4

Last rows

ปีงบประมาณ พ.ศ.ชื่อหน่วยงานชื่องานบริการจำนวนคำขอ
3832567กรุงเทพมหานครใบอนุญาตประกอบกิจการที่เป็นอันตรายต่อสุขภาพ : กิจการอื่นๆ1
3842567กรมปศุสัตว์ขอแก้ไขข้อมูลในใบรับรองการปฏิบัติทางการเกษตรที่ดีด้านปศุสัตว์ (GAP)1
3852567กรมปศุสัตว์ขอยกเลิกใบรับรองการปฏิบัติทางการเกษตรที่ดีด้านปศุสัตว์ (GAP)1
3862567กรมพัฒนาพลังงานทดแทนและอนุรักษ์พลังงานขอต่ออายุใบอนุญาตผลิตพลังงานควบคุม1
3872567กรมพัฒนาพลังงานทดแทนและอนุรักษ์พลังงานขอแก้ไขใบอนุญาตผลิตพลังงานควบคุม1
3882567กรมพัฒนาพลังงานทดแทนและอนุรักษ์พลังงานขอยกเลิกใบอนุญาตผลิตพลังงานควบคุม1
3892567กรมพัฒนาสังคมและสวัสดิการการรับรองเป็นองค์กรสวัสดิการชุมชน1
3902567กรมพัฒนาสังคมและสวัสดิการการรับรองเป็นองค์กรสาธารณประโยชน์ (กรณีมูลนิธิ หรือสมาคม)1
3912567กรมพัฒนาสังคมและสวัสดิการการรับรองเป็นองค์กรสาธารณประโยชน์ (กรณีองค์กรภาคเอกชน)1
3922567กรมพัฒนาสังคมและสวัสดิการการรับรองเป็นองค์กรสาธารณประโยชน์ (กรณีองค์กรภาคเอกชนในต่างประเทศ)1