MongoDB高级索引
假如在 users 集合中插入以下文档: > db.users.insert( ... { ... "address": { ... "city": "Hebei", ... "country": "China", ... "postcode": "000000" ... }, ... "tags": [ ..
详解pandas.DataFrame.describe()(计算数据框统计信息)函数使用方法
pandas.DataFrame.describe()的作用 pandas.DataFrame.describe()函数用于生成数据集的统计描述。它返回给定数据集的主要统计量,例如平均值、标准差、最小值、最大值和四分位数等。该函数的输出格式是一个数据帧(DataFrame),它显示了每个统计量的值以及数据集中的样本数。 使用方法 pandas.DataFrame.describe()函数可以应用于数据帧(DataFrame)或数据系列(S
MongoDB原子操作
维护原子性的推荐方法是保留所有相关信息,并将这些信息使用嵌入式文档的形式更新到文档中,这将确保单个文档的所有更新都是原子的。假设我们已经创建了一个名为 productDetails 的集合,并在其中插入了一个文档,如下所示: > db.productDetails.insert( ... { ... "product_name": "Samsung S3", ... "category": "mobiles&
详解pandas.DataFrame.drop_duplicates()(删除重复行)函数使用方法
pandas.DataFrame.drop_duplicates() 是 pandas 中常用的数据清洗方法,用于从 DataFrame 中删除重复行。 具体作用是去除 DataFrame 中重复的行,并返回去除后的新 DataFrame。同时,它还可以指定哪些列用于判断重复行,以及判断重复行时的行为。 使用方法: pandas.DataFrame.drop_duplicates(subset=None, keep='first
MongoDB $explain与$hint:查询分析
查询分析是衡量数据库和索引设计有效性的一个非常重要的方式。下面我们来介绍一下比较常用的 $explain 和 $hint 查询。 $explain $explain 运算符提供了有关查询、索引使用以及查询统计的相关信息,这在索引优化方面非常有用。《MongoDB覆盖索引查询》一节中我们已经使用以下代码在 users 集合中的 gender 和 name 字段上的创建了索引: > db.users.createIndex({gender:1, name:1}) {
详解pandas.DataFrame.groupby()(按列分组)函数使用方法
pandas.DataFrame.groupby()是pandas中用于分组聚合数据的方法。具体来说,它可以按照某些列的值将数据分组,并对每个分组进行聚合操作,如求和、平均、计数等。 使用方法: pandas.DataFrame.groupby()的基本语法为: df.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeez
详解pandas.replace()(替换数值)函数使用方法
pandas.replace() 函数的作用是将 DataFrame 或 Series 中的某一列或多列中的指定值替换为其他值或空值。其常用在数据清洗或转换的过程中。 pandas.replace() 的常用参数: to_replace:要替换的值,可以是单个值、多个值、字典或正则表达式 value:用来替换 to_replace 的值 inplace:是否在原 DataFrame 上进行修改,默认为 False limit:限制替换的
详解pandas.DataFrame.merge()(合并数据框)函数使用方法
pandas.DataFrame.merge()函数用于将两个DataFrame按照指定的一些键进行合并。可以实现类似于SQL中的join操作,将两个表按照某些键进行关联,并将它们合并为一个新的表。 语法格式为: pd.merge(left,right,how,on,left_on,right_on,left_index,suffixes) 参数说明: left:要合并的左侧DataFrame。 right:要合并的右侧DataF
详解pandas.dropna()(删除缺失值)函数使用方法
Pandas是一种非常流行的Python数据处理库,其中的dropna()是一个常用的功能,它可以删除包含缺失数据的行或列。这个函数的详细作用和使用方法,可以通过以下攻略来了解。 作用 当处理数据时,常常会遇到缺失值。这些缺失值如果不进行处理,会影响到我们的分析结果。使用dropna()可以方便地去除包含缺失值的行或列,帮助我们得到更准确的结果。 使用方法 Pandas的dropna()方法有几个参数可以配置,以下是完整的用法和说明: p
详解pandas.str.strip()(去除字符串空格)函数使用方法
pandas中的str.strip()是用于删除Series或DataFrame对象中字符串前后的空格或指定字符的方法。下面详细讲解其作用和使用方法,同时提供两个实例进行说明。 作用 在数据处理中,经常会出现字符串前后有空格的情况,使得字符串无法准确匹配。此时,就需要使用strip()方法来删除前后的空格。 同时,strip()方法还能删除前后指定的字符。对于数据处理中一些特殊字符,如"/"、"%"
详解pandas.rename()(重命名列名)函数使用方法
pandas.rename()是一个能够对DataFrame或Series的轴标签(即行或列的名称)进行修改的方法。它的语法如下: DataFrame.rename(index=None, columns=None, level=None, inplace=False, errors='ignore') 其中各参数的含义如下: index:用于指定行索引的新名称,它可以是单个名称、列表或字典形式。当axis=0时to
详解pandas.DataFrame.unstack()(将序列展开为数据框)函数使用方法
pandas.DataFrame.unstack()是一种数据结构转换函数,可以将具有多层索引的pandas DataFrame对象转换为单层DataFrame对象。它的作用是将DataFrame中的某些列作为列的索引,同时将行索引的某些级别旋转为新的列。 另外,unstack()函数还支持将多个索引级别转换为列,以及在转换时选择要使用的元素。 unstack()函数使用方法 语法: DataFrame.unstack(level=-1,
详解pandas.DataFrame.sort_values()(按值排序)函数使用方法
pandas.DataFrame.sort_values()的作用:该函数用于对数据框中的数据按照某一列或多列进行排序。 语法:pandas.DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, ignore_index=False, key=None) 参数解释: by: 排序的列名或列名的列表. axis: 0是按行排序,1是按列排序,默认是0. ascen
详解pandas.Series.str.contains()(检测序列中的字符串包含)函数使用方法
pandas.Series.str.contains()方法是pandas库中Series对象的一个字符串成员方法,用于判断一个字符串是否包含在Series对象的每个元素中,返回一个布尔型Series对象。 使用方法: Series.str.contains(self: ~FrameOrSeries, pat, case=True, flags=0, na=None, regex=True) -> ~FrameOrSeries 参数
MongoDB DBRefs:多表关联查询
在《MongoDB关系》一节中,为了在 MongoDB 中实现规范化的数据库结构,我们使用了引用式关系(也称为手动引用)的概念,在手动引用中,我们需要将被引用文档的 _id 存储在其他文档中。当文档中需要引用来自不同集合数据的情况下,我们可以使用 MongoDB 中的 DBRefs。 DBRefs 与手动引用 假如有这样一个数据库,其中有一个 users 集合,用来存储用户信息,以及其它一些集合(例如 address_home、address_office、address_mailin