当前位置: 首页 > news >正文

Pandas检查dataFrame中的NaN

NaN代表Not A Number,是表示数据中缺失值的常用方法之一。它是一种特殊的浮点值,不能转换为浮点数以外的任何其他类型。

NaN值是数据分析中的主要问题之一,为了得到理想的结果,对NaN进行处理是非常必要的。

检查Pandas DataFrame中的NaN值

在Pandas DataFrame中检查NaN的方法如下:

  • 使用isnull().values.any()方法检查NaN
  • 使用isnull().sum()方法统计NaN
  • 使用isnull().sum().any()方法检查NaN
  • 使用isnull().sum().sum()方法统计NaN

方法1:使用isnull().values.any()方法

# importing libraries
import pandas as pd
import numpy as np


num = {'Integers': [10, 15, 30, 40, 55, np.nan,
					75, np.nan, 90, 150, np.nan]}

# Create the dataframe
df = pd.DataFrame(num, columns=['Integers'])

# Applying the method
check_nan = df['Integers'].isnull().values.any()

# printing the result
print(check_nan)
# 输出 True

可以通过从isnull().values.any()中删除.values.any()来获得NaN值所在的确切位置。

df['Integers'].isnull()
0     False
1     False
2     False
3     False
4     False
5      True
6     False
7      True
8     False
9     False
10     True
Name: Integers, dtype: bool

方法2:使用isnull().sum()方法

# importing libraries
import pandas as pd
import numpy as np


num = {'Integers': [10, 15, 30, 40, 55, np.nan,
					75, np.nan, 90, 150, np.nan]}

# Create the dataframe
df = pd.DataFrame(num, columns=['Integers'])

# applying the method
count_nan = df['Integers'].isnull().sum()

# printing the number of values present
# in the column
print('Number of NaN values present: ' + str(count_nan))
Number of NaN values present: 3

方法3:使用isnull().sum().any()方法

# importing libraries
import pandas as pd
import numpy as np

nums = {'Integers_1': [10, 15, 30, 40, 55, np.nan, 75,
					np.nan, 90, 150, np.nan],
		'Integers_2': [np.nan, 21, 22, 23, np.nan, 24, 25,
					np.nan, 26, np.nan, np.nan]}

# Create the dataframe
df = pd.DataFrame(nums, columns=['Integers_1', 'Integers_2'])

# applying the method
nan_in_df = df.isnull().sum().any()

# Print the dataframe
print(nan_in_df)
# 输出 True

可以通过从isnull().sum().any()中删除.sum().any()来获得NaN值所在的确切位置。

方法4:使用isnull().sum().sum()方法

# importing libraries
import pandas as pd
import numpy as np

nums = {'Integers_1': [10, 15, 30, 40, 55, np.nan, 75,
					np.nan, 90, 150, np.nan],
		'Integers_2': [np.nan, 21, 22, 23, np.nan, 24, 25,
					np.nan, 26, np.nan, np.nan]}

# Create the dataframe
df = pd.DataFrame(nums, columns=['Integers_1', 'Integers_2'])

# applying the method
nan_in_df = df.isnull().sum().sum()

# printing the number of values present in
# the whole dataframe
print('Number of NaN values present: ' + str(nan_in_df))
Number of NaN values present: 8

参考

  • https://www.geeksforgeeks.org/check-for-nan-in-pandas-dataframe/

相关文章:

  • 网站开发接单平台/什么是搜索引擎优化seo
  • 注册公司那家网站做的比较好/百度怎么搜索网址打开网页
  • 泰兴网站推广/微信指数
  • 响应式网站布局/360摄像头海澳門地区限制解除
  • 网站建设柒首先金手指1/推广软文代写
  • 专业网站开发培训/百家号自媒体平台注册
  • (二十四)List系列集合
  • restful接口
  • Linux进程控制(进程替换)
  • 选购自主可控全国产交换机时, IP防护等级多少比较合适?
  • 初学者C语言练习题-指针
  • “笨办法”学Python 3 ——练习 33 While 循环
  • [面试题]java高性能的多计数器
  • Softmax Loss、AAM-Softmax(ArcFace)、Sub-center ArcFace的PyTorch实现与代码解读
  • 基于paddlex图像分类模型训练(一):图像分类数据集切分:文件夹转化为imagenet训练格式
  • 【021·未解】1947. 最大兼容性评分和【暴力回溯】
  • (1分钟速览)KBM-SLAM 论文阅读笔记
  • Linux:查看服务器信息,CPU、内存、系统版本、内核版本等