应急响应之Splunk

总字符数: 33.62K

代码: 18.08K, 文本: 7.33K

预计阅读时间: 1.84 小时

Splunk索引数据类型

在计算机科学和数据库领域,索引(Index)是一种数据结构,用于提高数据库表中数据的检索速度.索引可以看作是一本书的目录,它允许用户快速找到所需的信息,而不必扫描整个数据集.

索引的主要特点和作用:

提高查询速度:索引通过创建一个指向数据行的指针列表,使得数据库引擎能够快速定位到特定的数据行,从而大大加快查询操作的速度.

减少磁盘I/O:索引可以减少数据库系统需要读取的磁盘页数,因为索引通常存储在内存中,或者存储在磁盘上更紧凑的区域,从而减少了磁盘I/O操作.

唯一性约束:索引可以强制列的唯一性,确保表中的数据没有重复值.例如,主键索引就是一种唯一索引.

排序:索引可以自动对数据进行排序,这对于需要排序的查询非常有用.

加速连接操作:在多表连接查询中,索引可以显著提高连接操作的性能.

索引的类型:

B-Tree索引:最常见的索引类型,适用于范围查询和排序操作.

哈希索引:适用于等值查询,但不支持范围查询.

全文索引:用于文本搜索,支持复杂的文本匹配查询.

空间索引:用于地理空间数据,支持空间操作.

Splunk平台可以索引任何类型的数据.特别是Splunk平台可以索引任何和所有IT流、机器和历史数据,如Microsoft Windows事件日志、Web服务器日志、实时应用程序日志、网络流量、指标、更改监控、消息队列、存档文件等.

由于Splunk Enterprise是本机部署的,因此可以直接将数据导入实例,也可以使用通用或重型转发器来导入数据.一般来说,可以将Splunk Enterprise输入分类如下:

Files and directories —> 文件和目录
Network events —> 网络事件
Windows data —> Windows数据
Other sources —> 其他来源

文件和目录

使用文件和目录监视器输入处理器从文件和目录中获取数据.要监视文件和目录,请参阅从文件和目录获取数据.

网络事件

索引来自任何网络端口的数据,例如来自sysystem-ng或通过TCP协议传输的任何其他应用程序的远程数据.它还可以索引UDP数据,但尽可能使用TCP以增强可靠性.

Splunk Enterprise还可以接收和索引远程设备发出的SNMP事件和警报.

要从网络端口获取数据,请参阅从TCP和UDP端口获取数据.
要获取SNMP数据,请参阅将SNMP事件发送到Splunk部署.

Windows数据

Splunk Enterprise的Windows版本直接接受各种Windows特定的输入.使用Splunk Web可以配置以下Windows特定的输入类型:

Windows Event Log data —> Windows事件日志数据
Windows Registry data —> Windows注册表数据
Windows Management Instrumentation (WMI) data
Active Directory data —>Active Directory数据
Performance monitoring data —> 性能监控数据

Other sources 其他来源

Splunk Enterprise可以直接收集以下数据源:

使用HTTP事件收集器直接从具有HTTP或HTTPS协议的源获取数据.请参阅HTTP事件收集器端点
从技术基础设施、安全系统和业务应用程序中获取指标数据.请参阅Metrics
监视先进先出(FIFO)队列.请参阅监控先进先出(FIFO)队列
从API和其他远程数据接口以及消息队列获取数据.请参阅脚本输入
定义自定义输入功能来扩展Splunk Enterprise框架.请参阅Splunk开发者门户上的为Splunk Cloud Platform或Splunk Enterprise创建自定义数据输入

导入索引数据

示例:shop_access.log

导入数据—>点击下一步
点击—>下一步,事件换行选择每行名称及描述随便写
点击检查—>提交
上传成功后,点击搜索开始浏览数据叭~~~

字段提取器

Splunk提供了一种非常简单的方式来提取字段,就是使用字段提取器,即使在你完全不了解正则表达式的情况下,也可以轻松完成字段提取.

执行事件搜索,左边栏往下,单击提取新字段,进入字段提取器.
在事件列表中,选择一个需要进行字段提取的示例事件–>点击该事件—>下一步.
Splunk提供了两种字段提取的方法:正则表达式和分隔符.正则表达式主要用于非结构化数据；而基于表格的结构化数据,使用分隔符即可.
选择需要字段提取的值,下面会出现对话框,对字段名称进行命名.一般我们也可手动编辑正则表达式进行调整.
设置完成后点击下一步.可以对提取名称和权限进行设置,点击完成来保存提取.
开始搜索,选择所有字段,隐藏自带的字段,选择我们新增的字段
即可看到我们新增的字段内容

正则表达式提取secure中的相关字段

^(?P<timestamp>\w{3} \d{2} \d{2}:\d{2}:\d{2}) (?P<hostname>\S+) (?P<process>\S+)\[(?P<pid>\d+)\]: (?P<action>.+) for (?P<user>\S+) from (?P<source_ip>\d+\.\d+\.\d+\.\d+) port (?P<source_port>\d+) (?P<protocol>\S+)$

#  (?P<name>...)命名
# \S+: 匹配一个或多个非空白字符
# \d+: 匹配一个或多个数字
# .+: 匹配任意字符(包括空格）
# ^(?P<timestamp>\w{3} \d{2} \d{2}:\d{2}:\d{2})        # 匹配时间戳部分，格式为 "MMM DD HH:MM:SS"
# (?P<hostname>\S+)                                    # 匹配主机名，非空白字符
# (?P<process>\S+)                                    # 匹配进程名，非空白字符
# \[(?P<pid>\d+)\]:                                     # 匹配进程 ID，在方括号内，包含一个或多个数字
# (?P<action>.+)                                       # 匹配动作，包含一个或多个任意字符(贪婪匹配）
# for (?P<user>\S+)                                    # 匹配 "for" 后面的用户名，非空白字符
# from (?P<source_ip>\d+\.\d+\.\d+\.\d+)              # 匹配源 IP 地址，格式为四个由点分隔的数字
# port (?P<source_port>\d+)                            # 匹配源端口号，包含一个或多个数字
# (?P<protocol>\S+)$                                   # 匹配协议，非空白字符，行结束

搜索命令

基本搜索与过滤命令

search

使用 search 命令可以从索引中检索事件或过滤先前搜索结果.它可以使用关键字、带引号的短语、通配符和字段值表达式来查找事件.

隐含使用:在任何搜索的开头，search 命令是隐含的，你无需显式地写它.
过滤结果:你可以在搜索中使用 search 命令来过滤管道中上一个命令的结果.

通过检索事件后，你可以使用其他命令进行转换、筛选和报告.使用竖线(|）或管道字符将这些命令链接到检索到的事件.

注意!!!

search 命令支持使用CIDR表示法的IPv4和IPv6地址以及IP地址.

# 语法
search <logical-expression>

# 必须参数
<logical-expression>
# 语法: <逻辑表达式> | <时间选项> | <搜索修饰符> | NOT <逻辑表达式> | <索引表达式> | <比较表达式> | <逻辑表达式> [OR] <逻辑表达式>
语法: <logical-expression> | <time-opts> | <search-modifier> | NOT <logical-expression> | <index-expression> | <comparison-expression> | <logical-expression> [OR] <logical-expression>
描述: 包含用于描述要从索引中检索的事件的所有关键字或字段-值对.根据需要包含括号.使用布尔表达式、比较运算符、时间修饰符、搜索修饰符或这些表达式的组合作为此参数.
AND 运算符总是在术语和表达式之间隐含的.例如，web error 与 web AND error 相同.指定 clientip=192.0.2.255 earliest=-1h@h 与 clientip=192.0.2.255 AND earliest=-1h@h 相同.因此，除非出于清晰原因需要包含它，否则不需要指定 AND 运算符.

逻辑表达式

# 比较表达式
语法: <字段><比较运算符><值> | <字段> IN (<值列表>)
描述: 将字段与文字值进行比较，或提供字段中可以出现的值列表.
语法: = | != | < | <= | > | >=
描述: 在搜索字段/值对时可以使用比较运算符.使用等于 ( = ) 或不等于 ( != ) 运算符的比较表达式比较字符串值.例如，"1" 不匹配 "1.0".使用大于或小于运算符 < > <= >= 的比较表达式对两个数字进行数值比较，对其他值进行字典顺序比较.参见用法.

<field>
语法: <字符串>
描述: 字段的名称.

<value>
语法: <文字值>
描述: 在比较表达式中，字段的文字数字或字符串值.

<value-list>
语法: (<文字值>, <文字值>, ...)
描述: 与 IN 运算符一起使用，指定两个或更多值.例如，使用 error IN (400, 402, 404, 406) 而不是 error=400 OR error=402 OR error=404 OR error=406.

索引表达式

语法: "<字符串>" | <术语> | <搜索修饰符>
描述: 使用文字字符串和搜索修饰符描述要从索引中检索的事件.
# 索引表达式选项
<string>
语法: "<string>"
描述: 指定要匹配的关键字或带引号的短语.在搜索字符串和带引号的字符串(不是搜索修饰符的任何内容）时，Splunk 软件会在 _raw 字段中搜索匹配的事件或结果.

<search-modifier>
语法:  <sourcetype-specifier> | <host-specifier> | <hosttag-specifier> | <source-specifier> | <savedsplunk-specifier> | <eventtype-specifier> | <eventtypetag-specifier> | <splunk_server-specifier>
描述: 搜索来自指定字段或字段标签的事件.例如，搜索一个或多个主机、来源、来源类型、保存的搜索和事件类型的组合.还可以搜索字段标签，格式为:tag::<字段>=<字符串>.
更多关于使用默认字段进行搜索的信息，请参阅知识管理器手册.
更多关于使用标签和字段别名的信息，请参阅知识管理器手册.

<sourcetype-specifier>
语法: sourcetype=<字符串>
描述: 搜索来自指定来源类型字段的事件.

<host-specifier>
语法: host=<字符串>
描述: 搜索来自指定主机字段的事件.

<hosttag-specifier>
语法: hosttag=<字符串>
描述: 搜索具有被字符串标记的主机的事件.

<eventtype-specifier>
语法: eventtype=<字符串>
描述: 搜索与指定事件类型匹配的事件.

<eventtypetag-specifier>
语法: eventtypetag=<字符串>
描述: 搜索所有被字符串标记的事件类型匹配的事件.

<savedsplunk-specifier>
语法: savedsearch=<字符串> | savedsplunk=<字符串>
描述: 搜索由指定保存的搜索找到的事件.

<source-specifier>
语法: source=<字符串>
描述: 搜索来自指定来源字段的事件.

<splunk_server-specifier>
语法: splunk_server=<字符串>
描述: 搜索来自特定服务器的事件.使用 "local" 指代搜索头.

时间表达式

语法: [<时间格式>] (<时间修饰符>)...
描述: 描述搜索的开始时间和结束时间术语的格式.参见时间选项.

<timeformat>
语法: timeformat=<字符串>
描述: 设置开始时间和结束时间术语的时间格式.
默认: timeformat=%m/%d/%Y:%H:%M:%S.

<time-modifier>
语法: starttime=<字符串> | endtime=<字符串> | earliest=<时间修饰符> | latest=<时间修饰符>
描述: 使用相对或绝对时间指定开始和结束时间.
您还可以使用 earliest 和 latest 属性为您的搜索指定绝对和相对时间范围.有关此时间修饰符语法的更多信息，请参阅搜索手册中的指定搜索中的时间修饰符.

starttime
语法: starttime=<字符串>
描述: 事件必须晚于或等于此时间.必须匹配时间格式.

endtime
语法: endtime=<字符串>
描述: 所有事件必须早于或等于此时间.

当搜索是搜索中的第一个命令时，您可以使用关键字、短语、字段、布尔表达式和比较表达式等术语来精确指定要从 Splunk 索引中检索哪些事件.如果您没有指定字段，搜索会在 _raw 字段中查找这些术语.

一些搜索术语的例子包括:

关键字:error login == error AND login
引用的短语:"database error"
布尔运算符:login NOT (error OR fail)
通配符:fail*
字段-值对:status=404, status!=404, 或 status>200

注意!!! 要搜索字段值是 SPL 运算符或关键字的情况则需要转义~

转义

在使用搜索命令时，如果短语或字段值中包含空格、逗号、管道、引号或括号，你需要用引号将它们括起来.引号必须是成对出现的.例如:

搜索 error | stats count 会统计包含“error”这个词的事件数量.
搜索 ... | search "error | stats count" 会返回包含error、|、stats和count按顺序出现的事件.

如果你想把某些关键字当作普通的字符串对待，而不是它们的默认含义，比如布尔运算符或特定的字段/值对，你也需要用引号把它们括起来.例如:

搜索 error "AND" 会查找包含AND这个词的事件.
搜索 error "startswith=foo" 会查找包含startswith=foo这个短语的事件.

反斜杠(\）可以用来转义特殊字符，比如引号、管道和反斜杠本身.例如:

\" 会被当作字符串引号.
\\ 会被当作字符串反斜杠.
\| 会被当作字符串管道.

示例

比较两个字段

1	source="shop_access.log" \| where fieldsA=fieldsB

对于不相等的比较，您可以通过多种方式指定条件.

1 2	source="shop_access.log" \| where fieldA!=fieldB source="shop_access.log" \| where NOT fieldA=fieldB

使用IN运算符进行多个字段值比较

source="shop_access.log" | status IN(200,301,302,500)
# 包含字符
source="shop_access.log" | status IN(error,warning)
# NOT运算符与IN运算符一起使用
source="shop_access.log" | NOT clientip IN (211.166.11.101, 182.236.164.11, 128.241.220.82)

CIDR匹配

search 命令可以对包含IPv4和IPv6地址的字段执行CIDR匹配.

# 假设 ip 字段包含以下值:
172.32.162.49
172.32.172.59
172.32.172.84
172.32.229.172
172.33.114.186
172.33.117.114
172.33.117.18
172.33.117.38
172.33.117.63
172.33.117.97
172.33.118.158
172.33.127.119
172.33.127.122
172.33.127.131
172.33.127.147
172.33.127.155
172.33.127.172
172.33.127.205
172.33.127.68
172.33.127.88
172.33.127.90
172.33.127.97

source="shop_access.log" status=200 | stats count by ip | search ip="172.33.127.0/24"

字段值对匹配

1 2	# 源IP等于10.9.165.* 或者目的IP等于10.9.165.8 src="10.9.165.*" OR dst="10.9.165.8"

使用布尔运算符和比较运算符

1
2
3

source="shop_access.log" (status=200 OR status=304) ip!="172.33.127.97"
# 或
source="shop_access.log" status IN(200,304) ip!="172.33.127.97"

使用通配符

1
2
3

source="shop_access.log" (status=3* OR status=4*)
# 或
source="shop_access.log" status IN(4*, 5*)

fields

根据字段列表条件保留或删除搜索结果中的字段.

默认情况下，内部字段 _raw 和 _time 包含在Splunk Web的输出中.使用 outputcsv 命令可以在输出中包含其他内部字段.参见用法.

# 语法
fields [+|-] <wc-field-list>

# 必须参数
<wc-field-list>
    语法: <字段>, <字段>, ...
    描述: 要保留或删除的字段的逗号分隔列表.可以使用星号(*）作为通配符来指定具有相似名称的字段列表.例如，如果你想指定所有以 "value" 开头的字段，可以使用通配符，如 value*.

# 可选参数
+ | -
    语法: + | -
    描述: 如果指定加号(+）符号，则仅保留 wc-field-list 中的字段在结果中.如果指定减号(-）符号，则从结果中删除 wc-field-list 中的字段.
    默认值: +

示例

从结果中删除 length 和 response_time 字段

1	source="shop_access.log" \| fields - length, response_time

仅保留 host 和 ip 字段.删除所有内部字段.内部字段开始以下划线字符开头，例如 _time
1
source="shop_access.log" | fields length, response_time| fields - *
仅保留字段 source 、 sourcetype 、 host 以及所有以 error 开头的字段
1
source="shop_access.log" | fields source, sourcetype, host, error*

where

where 命令使用eval-expressions来过滤搜索结果.这些eval-expressions必须是布尔表达式，其中表达式返回true或false

# 语法
where <eval-expression>

# 必须参数
eval-expression
语法: <eval-mathematical-expression> | <eval-concatenate-expression> | <eval-comparison-expression> | <eval-boolean-expression> | <eval-function-call>
描述: 由值、变量、运算符和函数组成的表达式，表示目标字段的值.参见用法.
# <eval-expression> 是区分大小写的.在运行搜索之前会检查 eval 表达式的语法，对于无效的表达式会抛出异常.

Where命令使用与eval命令相同的表达式语法.此外，这两个命令都将带引号的字符串解释为文字.如果该字符串未加引号，则将其视为字段名.因此，您可以使用Where命令来比较两个不同的字段，这是search命令不能完成的.

命令	示例	描述
where	`where ipaddress=clientip`	查找字段 `ipaddress` 等于字段 `clientip` 的事件.
search	`search host=www2`	查找字段 `host` 包含字符串值 `www2` 的事件
where	`where host="www2"`	查找字段 `host` 中的值为字符串值 `www2` 的事件.

Where并且可以像Mysql数据库那样使用Like命令来模糊匹配

like 函数允许使用百分号%作为通配符，来匹配任意数量的字符

# 查找 ipaddress 字段的值以198.开始的事件
source="shop_access.log" status=200 | where like(ipaddress, "198.%")
# 查找IP地址或子网的事件
source="shop_access.log" status=200 | where like(src, "10.9.165.%") OR cidrmatch("10.9.165.0/25", dst)
source="shop_access.log" status=200 | where uri like "%admin%"

uniq、dedup

# 描述: uniq 命令会根据事件的完整内容进行去重，如果两个事件在所有字段上的值都相同，它们将被视为重复并被移除.
# 语法
uniq
source="shop_access.log" status=200 | uniq

# 描述: 根据特定字段进行去重
# 语法
dedup filed1 filed2
source="shop_access.log" status=200 | dedup uri ip

accum

对于每个事件,其中 field 是一个数字, accum 命令计算运行总数或数字之和.累计的总和可以返回到相同的字段或您指定的 newfield .

# 语法
accum <field> [AS <newfield>]
# 必须参数
field
    语法: <字符串>
    描述: 要计算累计和的字段名称.该字段必须包含数值.
# 可选参数
newfield
    语法: <字符串>
    描述: 要将结果放置在的新字段名称.
# 示例
假设我们有一个包含销售数据的日志,其中有一个字段名为 response_time ,我们想计算这个字段的累计和,并将结果放在一个新字段
cumulative_response_time  中,可以使用以下命令:

source="shop_access.log" status=200 | accum response_time as cumulative_response_time | table ip,uri,cumulative_response_time

数据提取与转换命令

regex

搜索与指定正则表达式匹配或不匹配的结果

eval

eval 命令能帮你计算东西并把结果放到搜索结果里.如果结果里没有指定的字段则会新建一个字段,如果结果里已经有这个字段，它会用新计算的结果替换原来的值.
eval 命令可以处理数字、文字和逻辑判断.

如果想连续用多个 eval 命令可以用逗号分割，它会按顺序执行，并且后面的命令可以用前面命令的结果.

eval和stats命令的区别 stats 命令是用来统计事件中的字段数据的，而 eval 命令则是通过已有字段和表达式来创建新字段

# 语法
eval <field>=<expression>["," <field>=<expression>]...

# 必须参数
field
    语法: <字符串>
    描述: 用于存放计算结果的目标字段名称.如果该字段名称已存在于事件中，eval 会覆盖其值.
expression
    语法: <字符串>
    描述: 由值、变量、运算符和函数组成的组合，用于执行计算以确定放入目标字段的值.
    eval 表达式是区分大小写的.在运行搜索之前会检查 eval 表达式的语法，对于无效的表达式会抛出异常.
    * eval 表达式的结果不能是布尔值.
    * 如果在搜索时，对于某个事件无法成功评估表达式，eval 命令会清除结果字段.
    * 如果表达式引用的字段名称包含非字母数字字符(下划线 _ 除外），则该字段名称需要用单引号包围.例如，如果字段名称是 server

示例

创建包含计算结果的新字段

1 2	# 在每个事件中创建一个名为 velocity 的新字段.通过将距离字段中的值除以时间字段中的值来计算速度. source="shop_access.log" \| eval velocity=distance/time

使用if函数分析字段值

1
2

# 在每个事件中创建一个名为 attack 的字段.如果 action值为Failed password，则使用 if 功能将 attack 字段中的值设置为Yes,否则为No
source="secure" |eval attack  = if(action == "Failed password", "Yes", "No")| table action,attack

将状态设置为一些简单的http错误代码

1	source="shop_access.log" \| eval status_msg = case(status == 404, "Not found", status == 500, "Internal Server Error", status == 200, "OK") \| table status,status_msg

rename

使用 rename 命令来重命名一个或多个字段.这个命令对于给字段赋予更有意义的名称非常有用，例如将 “pid” 改为 “Product ID”.如果你想重命名名称相似的字段，可以使用通配符.

# 语法
rename <wc-field> AS <wc-field>.

# 必须参数
wc-field
	Syntax: <string>
	字段的名称和要替换它的名称.包含空格的字段名称必须用引号括起来.你可以使用星号(*）作为通配符来指定具有相似名称的字段列表.例如，如果你想指定所有以 "value" 开头的字段，可以使用类似 value* 的通配符.

示例

如果字段名称为短语时

1 2	# 使用双引号将短语包裹起来 source="shop_access.log" \| rename status AS "The Web_logs Status"

多个名称相似的字段

# 将以下字段的EU修改为EMEA
# EU_UK
# EU_DE
# EU_PL
| rename EU* AS EMEA*
# 修改后的内容
# EMEA_UK
# EMEA_DE
# EMEA_PL

修改需转义的字段名

1 2	# 如http\\:8000重命名为localhost:8000 \| rename http\\\\:* AS localhost:*

修改包含空格的字段名
1
| rename count AS "Count of Events"

数据聚合与统计命令

stats

计算结果集的聚合统计信息，如平均值、计数和总和.这类似于SQL聚合.如果在没有 BY 子句的情况下使用 stats 命令，则仅返回一行，这是整个传入结果集的聚合.如果使用 BY 子句，则为 BY 子句中指定的每个非重复值返回一行.

注意!!! stats 命令根据事件中的字段计算统计信息.eval命令通过使用现有字段和任意表达式在事件中创建新字段

# 语法
stats (stats-function(field) [AS field])... [BY field-list]

# 完整语法
| stats # 必须
[partitions=<num>]
[allnum=<bool>]
[delim=<string>]
( <stats-agg-term>... | <sparkline-agg-term>... ) # 必须
[<by-clause>]
[<dedup_splitvals>]

# 必须参数
stats-agg-term
    语法: <stats-func>(<evaled-field> | <wc-field>) [AS <wc-field>]
    描述: 一个统计聚合函数.参考统计函数选项.该函数可以应用于一个 eval 表达式，或一个字段或一组字段.使用 AS 子句将结果放入一个你指定名称的新字段中.你可以在字段名称中使用通配符.更多关于 eval 表达式的信息，请参阅《搜索手册》中的 eval 表达式类型.
sparkline-agg-term
    语法: <sparkline-agg> [AS <wc-field>]
    描述: 一个迷你图聚合函数.使用 AS 子句将结果放入一个你指定名称的新字段中.你可以在字段名称中使用通配符.

# 可选参数
allnum
    语法: allnum=<bool>
    描述: 如果为 true，则仅当该字段的所有值都是数值时，才对该字段计算数值统计.
    默认值: false
by-clause
    语法: BY <field-list>
    描述: 一个或多个字段名称，用于分组.你不能使用通配符来指定多个名称相似的字段.你必须单独指定每个字段.BY 子句为 BY 子句字段中的每个不同值返回一行.如果没有指定 BY 子句，stats 命令只返回一行，这是对整个传入结果集的聚合.
dedup_splitvals
    语法: dedup_splitvals=<boolean>
    描述: 指定是否在多值 BY 子句字段中去除重复值.
    默认值: false
delim
    语法: delim=<string>
    描述: 指定 list() 或 values() 聚合中的值的分隔符.
    默认值: 单个空格
partitions
    语法: partitions=<num>
    描述: 基于分割字段对输入数据进行分区，以便进行多线程归约.partitions 参数在同一搜索进程的同一台机器上使用多个线程运行归约步骤(并行归约处理）.与之相比，使用 redistribute 命令的并行归约在多台机器上并行运行归约步骤.
    当 partitions=0 时，partitions 参数的值与 limits.conf 文件中的 default_partitions 设置相同.
    默认值: 0.设置为与 limits.conf 文件中的 default_partitions 设置相同的值，默认情况下为 1.

统计函数选项

1
2
3

stats-function
语法:语法取决于你使用的函数.
描述:可以与 stats 命令一起使用的统计和图表函数.每次调用 stats 命令时，你可以使用一个或多个函数.不过，你只能使用一个 BY 子句.

下表列出了按函数类型分类的支持函数.使用表中的链接可以查看每个函数的描述和示例.关于与命令一起使用函数的概述，请参见统计和图表函数.

函数类型	支持的函数和语法
聚合函数	`avg()` `count()` `distinct_count()` `estdc()` `estdc_error()` `exactperc<num>()` `max()` `median()` `min()` `mode()` `perc<num>()` `range()` `stdev()` `stdevp()` `sum()` `sumsq()` `upperperc<num>()` `var()` `varp()`
事件顺序函数	`first()` `last()`
多值统计和图表函数	`list()` `values()`
时间函数	`earliest()` `earliest_time()` `latest()` `latest_time()` `rate()`

示例

统计不同状态码的分布

1	source="shop_access.log" \| search status IN(200,301,302,404,501) \| stats count BY status \| sort - count

分析 HTTP 响应时间，识别是否有异常的响应时间.
1
source="shop_access.log" | stats avg(response_time) BY uri
统计每个 IP 地址的访问次数，识别可能的攻击者 IP.
1
source="shop_access.log" |stats count by ip | sort - count

检测某个用户的登录尝试次数，识别是否有暴力破解行为.

1	source="secure" \| search action = "Failed password" \| stats count by user \| sort - count

单一账号，5分钟内超过20次登录失败

1	source="secure" \| search action = "Failed password" \| bucket _time span=5m \| stats count by user,source_ip

top

# 查找字段列表中最常见的值.计算这些值在事件中出现的频率计数和百分比.如果包含 <by-clause>，则结果按你在 <by-clause> 中指定的字段进行分组.
# 语法:
top [<N>] [<top-options>...] <field-list> [<by-clause>]
# 必须参数
<field-list>
    语法: <field>, <field>, ...
    描述: 逗号分隔的字段名称列表.
# 可选参数
<N>
    语法: <int>
    描述: 要返回的结果数量.
    默认值: 10
    
<top-options>
    语法: countfield=<string> | limit=<int> | otherstr=<string> | percentfield=<string> | showcount=<bool> | showperc=<bool> | useother=<bool>
    描述: top 命令的选项. 参考 Top 选项.
    
<by-clause>
    语法: BY <field-list>
    描述: 一个或多个字段名称，用于分组.

top选项

# Top 选项
countfield
    语法: countfield=<string>
    描述: 对于 top 命令返回的每个值，结果还会返回具有该值的事件的计数.此参数指定包含计数的字段的名称.计数默认返回.如果不希望返回事件的计数，请指定 showcount=false.
    默认值: count

limit
    语法: limit=<int>
    描述: 指定要返回多少结果.要返回所有值，请指定零 (0).指定 top limit=<int> 与指定 top N 相同.
    默认值: 10

otherstr
    语法: otherstr=<string>
    描述: 如果 useother=true，则会在结果中添加一行，代表所有其他值.使用 otherstr=<string> 指定该行的标签名称.
    默认值: OTHER

percentfield
    语法: percentfield=<string>
    描述: 对于 top 命令返回的每个值，结果还会返回具有该值的事件的百分比.此参数指定包含百分比的字段的名称.百分比默认返回.如果不希望返回事件的百分比，请指定 showperc=false.
    默认值: percent

showcount
    语法: showcount=<bool>
    描述: 指定是否创建一个名为 "count" 的字段(参见 "countfield" 选项），其中包含该元组的计数.
    默认值: true

showperc
    语法: showperc=<bool>
    描述: 指定是否创建一个名为 "percent" 的字段(参见 "percentfield" 选项），其中包含该元组的相对流行度.
    默认值: true

useother
    语法: useother=<bool>
    描述: 指定是否添加一行，代表由于限制截止而未包括的所有值.
    默认值: false

示例

返回字段的20个最常见值

# 用户名
source="secure" | search action = "Failed password"| top limit=20 user
# 攻击IP
source="secure" | search action = "Failed password"| top limit=20 source_ip

按 user字段分组，并计算 source_ip的频率

1	source="secure" \| search action = "Failed password"\| top source_ip by user

rare

显示字段中最不常用的值.

示例

返回字段中不常见的值
1
source="shop_access.log" | rare 20 uri

返回按uri字段中不常见的值

1	source="shop_access.log" \| rare ip by uri

数据转换与操作命令

table

table 命令返回一个仅由参数中指定的字段组成的表.列的显示顺序与字段的指定顺序相同.列标题是字段名称.是字段值.每一行代表一个事件.

table 命令类似于 fields 命令，因为它允许您指定要在结果中保留的字段.当你想保留表格格式的数据时，使用 table 命令.

要优化搜索，请避免将 table 命令放在搜索的中间，而是将其放在搜索的末尾.

# 语法
table <wc-field-list>

# 参数
<wc-field-list>

- 语法: <wc-field> ...
- 描述: 有效字段名称的列表.该列表可以用空格或逗号分隔.你可以使用星号( * ）作为通配符来指定名称相似的字段列表.

# 示例
# 只显示ip,uri,response_time字段
source="shop_access.log" | table ip,uri,response_time

需要注意的是

要生成可视化图表，搜索结果必须包含数值、日期时间或聚合数据，如计数、求和或平均值.
table 命令不允许你重命名字段，只能指定你希望在表格结果中显示的字段.如果你打算重命名字段，请在将结果传递给 table 命令之前进行.
table 命令根据 limits.conf 文件中的设置截断返回的结果数量.在search节中，如果truncate_report参数的值为 1，则返回的结果数量会被截断.结果数量由search节中的max_count参数控制.如果truncate_report设置为 0，则不应用max_count参数.

sort

sort 命令按指定字段对所有结果进行排序.如果顺序分别为降序或升序，则缺少给定字段的结果将被视为具有该字段的最小或最大可能值.

如果 sort 命令的第一个参数是一个数字，那么最多按顺序返回这么多结果.如果未指定数字，则使用默认限制10000.如果指定数字0，则返回所有结果.

# 语法
sort
[<count>]
<sort-by-clause>... 
[desc]

# 必须参数
<sort-by-clause>
语法: [ - | + ] <sort-field>, ( - | + ) <sort-field> ...
描述: 要排序的字段列表及排序顺序.使用减号 (-) 表示降序，使用加号 (+) 表示升序.当指定多个字段时，用逗号分隔字段名称.参见排序字段选项.

# 可选参数
<count>
语法: <int> | limit=<int>
描述: 指定从排序结果中返回的结果数量.如果未指定数量，则使用默认限制 10000.如果指定为 0，则返回所有结果.可以使用整数指定数量，或者在数量前面加上标签，例如 limit=10.

desc
语法: d | desc
描述: 反转结果的顺序.如果指定了多个字段，将按指定字段的顺序反转字段值的顺序.例如，如果指定了三个字段，desc 参数将反转第一个字段的值顺序.对于第一个字段中每组重复的值，反转第二个字段的对应值顺序.对于第二个字段中每组重复的值，反转第三个字段的对应值顺序.

# 排序字段选项
<sort-field>
语法: <field> | auto(<field>) | str(<field>) | ip(<field>) | num(<field>)
描述: 可以与 <sort-field> 一起指定的选项.

<field>
语法: <string>
描述: 要排序的字段名称.

auto
语法: auto(<field>)
描述: 自动确定字段值的排序方式.

ip
语法: ip(<field>)
描述: 将字段值转换为 IP 地址.

num
语法: num(<field>)
描述: 将字段值转换为数字.

str
语法: str(<field>)
描述: 将字段值转换为字符串，并按字母顺序排序.

示例

按 ip字段以升序对结果进行排序，然后按url字段以降序进行排序
1
source="shop_access.log" | sort ip(ip),-str(uri)
按length字段的降序对前100个结果排序，然后按uri值的升序排序
1
source="shop_access.log" | sort -num(length),+str(uri)
按_time字段升序对结果排序，然后按ip值降序对结果排序.
1
source="shop_access.log" | sort _time, -host

返回最近的事件

1	source="shop_access.log" \| sort 1 -_time

bin

通过调整·<field> 的值，将连续的数值放入离散的集合或区间(bins），使特定集合中的所有项目具有相同的值.

“箱数”: 指的是数据被分割成的不同组或类别的数量.在数据分析中，当我们说”箱数”时，我们通常是指将连续的数据值分成若干个区间或”箱子”，每个”箱子”包含一组特定的数据点.这样做可以帮助我们更直观地理解数据的分布情况.例如，如果你有一组学生的考试成绩，你可以将这些成绩分成几个”箱子”，比如60分以下、60-70分、70-80分等等，这样每个”箱子”就代表了一个分数段.

# 语法
bin [<bin-options>...] <field> [AS <newfield>]

# 必须参数
field
语法: <field>
描述: 指定字段名称.

# 可选参数
bin-options
语法: bins | minspan | span | <start-end> | aligntime
描述: 离散化选项

newfield
语法: <string>
描述: 字段的新名称.

Bins-options

# bins
语法: bins=<int>
描述: 设置离散化为的最大箱数.默认值在 limits.conf 文件中的 [discretize] 节中设置.
默认值: 100

# minspan
语法: minspan=<span-length>
描述: 指定用于自动推断跨度的数据时间范围的最小跨度.


# span
语法: span = <log-span> | <span-length>
描述: 设置每个箱的大小，使用基于对数的跨度或基于时间的跨度.使用一天或更长时间的 span-length 时，跨度对齐到用户时区的午夜.

# <start-end>
语法: start=<num> | end=<num>
描述: 设置数值箱的最小和最大范围.分析字段中的数据并确定起始值和结束值.当未指定跨度值时，使用 start 和 end 参数.只能使用 start 或 end 参数扩展范围，而不能缩短范围.例如，如果字段表示秒且值范围为 0-59.如果指定跨度为 10，则按 10 的增量计算箱.箱的范围为 0-9, 10-19, 20-29，以此类推.如果未指定跨度，但指定 end=1000，则根据实际起始值和结束值 1000 计算箱.如果设置 end=10 且值 >10，则 end 参数无效.

# aligntime
语法: aligntime=(earliest | latest | <time-specifier>)
描述: 将箱时间对齐到基础 UTC 时间(epoch 0）以外的时间.aligntime 选项仅在进行基于时间的离散化时有效.如果跨度为天、月或年，则忽略.

Span 选项

“对数基跨度”是一种用于将数据分箱的特殊方式，基于对数比例来确定每个箱子的范围.它并不是按照线性等间距来分箱，而是按照某个对数规则来分箱.

具体来说:

系数:这是对数跨度的第一个数字，表示每个箱子的宽度相对于前一个箱子的增长因子.

基数:这是对数跨度的第二个数字，表示对数的底数.

例如，如果你设置跨度为 2log10，这意味着你使用以10为底的对数，并且每个箱子的范围是前一个箱子的2倍.

通俗地解释，对数基跨度就是根据对数的增长规律来划分数据，比如:

第一个箱子可能是1-10，

第二个箱子是10-100，

第三个箱子是100-1000，
依此类推.每个箱子的范围按对数增长，而不是等间距增长.这样做有助于处理数据范围非常广泛的情况，使得每个箱子能更好地代表不同数量级的数据.

# log-span
语法: [<num>]log[<num>]
描述: 设置对数基跨度.第一个数字是系数.第二个数字是基数.如果提供第一个数字，则必须是 >= 1.0 且 < 基数的实数.基数(如果提供）必须是 > 1.0 的实数.

示例: span=2log10

span-length
语法: <int>[<timescale>]
描述: 每个箱的跨度.如果基于 _time 字段进行离散化或与时间尺度一起使用，则视为时间范围.否则，这就是一个绝对的箱长度.

时间尺度

<timescale>

# 语法:
<sec> | <min> | <hr> | <day> | <month> | <subseconds>

# 描述: 时间尺度单位.如果基于 _time 字段进行离散化.

# 默认值: sec

时间尺度	语法	描述
<sec>	s \| sec \| secs \| second \| seconds	秒为单位的时间尺度.
<min>	m \| min \| mins \| minute \| minutes	分钟为单位的时间尺度.
<hr>	h \| hr \| hrs \| hour \| hours	小时为单位的时间尺度.
<day>	d \| day \| days	天为单位的时间尺度.
<month>	mon \| month \| months	月为单位的时间尺度.
<subseconds>	us \| ms \| cs \| ds	微秒 (us)、毫秒 (ms)、厘秒 (cs) 或十分之一秒 (ds) 为单位的时间尺度.

示例

1天内超过3个城市登录即可视为异地登录异常.

1	source="secure" action="Filed password" \| bin _time span=1d \|iplocation ip \| stats values(ip) as ip values(City) as City dc(City) as src_count by user\|search src_count>3

1天内同一个ip登录超过10个账号

1	source="secure" action="Accepted" \| bin _time span=1d \| stats count(user) by ip\| rename count(user) as User_count \| search User_count>10

凌晨0点到早上8点内，登录成功的账号.

1	source="secure" action="Accepted" date_hour<8 \| table _time,ip,user

删除索引数据

当您添加数据时,索引器将处理数据并将其存储在索引中.默认情况下,提供给索引器的数据存储在主索引中,可以为不同的数据输入创建和指定其他索引.

索引是目录和文件的集合.它们位于 $SPLUNK_HOME/var/lib/splunk 下.索引目录也称为存储桶,按时间组织.

除了主索引之外,Splunk Enterprise还预配置了许多内部索引.内部索引开始以下划线_开头;例如_audit和_internal.
要查看内部索引的完整列表,请转到Splunk Web,选择导航–>设置—>索引.

删除索引和索引数据

从索引器中删除索引数据甚至整个索引.这些是主要的选择:

从后续搜索中删除事件.
从一个或多个索引中删除所有数据.
删除或禁用整个索引.

注意!!!

删除数据是不可逆的.如果希望在使用本教程中介绍的任何技术删除数据后恢复数据,则必须对适用的数据源重新编制索引.

从后续搜索中删除事件

Splunk 的搜索语言提供了 delete 命令,用来从后续的搜索结果中删除事件数据.这个命令只能用于事件索引,不能用于度量索引.

需要注意的是,你不能在实时搜索中使用 delete 命令.如果你在实时搜索中尝试使用这个命令,Splunk Enterprise 会显示错误.

度量索引(Metrics Index)是Splunk中的一种特殊类型的索引,专门用于存储和处理时间序列数据,例如性能指标、统计数据或其他度量数据.与传统的事件索引不同,度量索引针对高效存储和快速检索设计,特别适合处理大量、频繁更新的数据.

注意!!!

delete 命令仅从后续搜索中删除事件.数据本身仍保留在索引中.

delete 命令只能由具有delete_by_keyword功能的用户运行.默认情况下,Splunk Enterprise附带了一个特殊的角色can_delete,它具有此功能(没有其他功能).默认情况下,管理员角色没有此功能.建议您创建一个特殊用户,以便在删除索引数据时登录到该用户.

首先运行一个搜索,返回您要删除的事件.请确保此搜索仅返回要删除的事件,而不返回其他事件.一旦确定了这一点,就可以将搜索结果传递给 delete 命令.

例如,如果要从名为 shop_access.log 的源中删除已编入索引的事件,使其不再出现在搜索中,请执行以下操作:

禁用或删除该源,使其不再被索引.
在索引中搜索来自该源的事件:
1
source="shop_access.log"
查看结果以确认这是您要删除的数据.
确认这是您要删除的数据后,将搜索路径设置为 delete
1
source="shop_access.log" | delete
将搜索连接到 delete 命令会标记该搜索返回的所有事件,以便后续搜索不会返回这些事件.任何用户(即使具有管理员权限)在搜索时都无法看到此数据.
注意!!!
连接到 delete 不会回收磁盘空间.数据实际上并没有从索引中删除;它只是对搜索不可见.
delete 命令不会更新事件的元数据,因此任何元数据搜索仍将包括事件,尽管它们不可搜索.主“所有索引数据”仪表板仍将显示已删除源、主机或源类型的事件计数.

从一个或所有索引中删除所有数据

要从磁盘中永久删除索引数据,请使用CLI clean 命令.
此命令完全删除一个或所有索引中的数据,具体取决于您是否提供了 <index_name> 参数.
通常,在重新索引所有数据之前运行 clean .
注意: clean 命令不适用于聚集索引.
以下是使用 clean 命令的主要方法:

要访问 clean 的帮助页面,请键入以下内容:

D:\Software\Splunk\bin>splunk.exe help clean
警告:服务器证书主机名验证已禁用.请参阅 server.conf/[sslConfig]/cliVerifyServerName 了解详情.
    clean 命令用于删除 Splunk 安装中的事件数据、全局数据和用户账户数据.
    永久删除索引中的事件数据,请输入 "./splunk clean eventdata".设置 index 参数以删除特定索引中的事件数据.如果不设置索引,Splunk 将删除所有索引中的所有事件数据.
    通过输入 "./splunk clean globaldata" 删除 Splunk 中的全局数据(你索引的事件的标签和源类型别名).
    通过输入 "./splunk clean userdata" 删除 Splunk 中的用户数据(你创建的用户账户).
    ** 注意: **
    删除数据是不可逆的.在选择要从 Splunk 安装中删除的数据时请谨慎.如果需要恢复数据,必须重新索引适用的数据源.
    ** 提示: **
    添加 -f 参数以强制 clean 跳过其确认提示.

    语法:
        clean  eventdata [-f] [-index <名称>] [--remote=<布尔值>]
        clean  (globaldata|userdata|locks|all|deployment-artifacts) [-f]
        clean  all [--remote=<布尔值>]
        clean  inputdata [<方案>]
        clean  kvstore [-f] (-local|-all|-app <应用名称>|-app <应用名称> -collection <集合名称>|-cluster)
        clean  raft [-f]
    对象:
          eventdata    导出的作为原始日志文件索引的事件
          globaldata   主机标签,源类型别名
          userdata     用户账户
          inputdata    模块化输入检查点数据
          locks        内部锁文件(仅在 Splunk 支持建议时)
          kvstore      应用程序键/值存储数据库
          raft         搜索头集群 raft 配置
          all          上述所有内容；*不包括* deployment-artifacts
          deployment-artifacts    由实例创建的文件,该实例曾作为部署服务器或部署客户端
                                  (仅在 Splunk 支持建议时)
    必需参数:
         eventdata    如果没有指定索引,默认是清理所有索引
         inputdata    如果没有指定模块化输入方案,默认是清理所有注册的模块化输入的数据
         kvstore      没有默认模式,必须给定有效模式
    可选参数:
         eventdata    index        应清理事件数据的索引名称
                       f            强制 clean 跳过其确认提示
                                    (清理无法撤销.请谨慎使用！)
                       --remote=    <true/ false> 覆盖默认配置并清理/跳过远程索引
         globaldata   f            强制 clean 跳过其确认提示
                                    (清理无法撤销.请谨慎使用！)
         userdata     f            强制 clean 跳过其确认提示
                                    (清理无法撤销.请谨慎使用！)
         kvstore      local        删除本地键值存储数据库
                       all          从所有应用集合中删除数据
                       app          从特定应用集合中删除数据
                       collection   从特定集合中删除数据
                                    (只能与 app 参数一起使用)
                       cluster      删除当前 kvstore 集群配置
                                    (当你想将当前实例移出 SHC/SHP 并保留数据时使用)
                       f            强制 clean 跳过其确认提示
                                    (清理无法撤销.请谨慎使用！)
         raft         f            强制 clean 跳过其确认提示
                                    (清理无法撤销.请谨慎使用！)
         all          --remote=    <true/ false> 覆盖默认配置并清理/跳过远程索引
    示例:
          ./splunk clean eventdata
          ./splunk clean globaldata
          ./splunk clean eventdata -index main -f
          ./splunk clean eventdata --remote=true
          ./splunk clean inputdata s3

    输入 "help [对象|主题]" 查看特定对象或主题的帮助.
    完整的文档可在以下网址在线获取:http://docs.splunk.com/Documentation

关闭splunk
splunk.exe clean eventdata -index main -f
启动splunk

完全删除索引

要从非集群索引器中完全删除索引(而不仅仅是其中包含的数据),使用Splunk Web或CLI.也可以直接编辑 indexes.conf

在删除索引之前,请查看索引器上的所有 inputs.conf 文件以及向索引器发送数据的任何转发器,并确保没有任何节将数据定向到您计划删除的索引.例如,如果你想删除一个名为nogood的索引,请确保以下属性/值对不会出现在你的任何输入节中: index=nogood .一旦索引被删除,索引器将丢弃仍发送到该索引的任何数据.

要在Splunk Web中删除索引,请导航到设置>索引,然后单击要删除的索引右侧的删除.此操作将删除索引的数据目录,并从 indexes.conf 中删除索引的节.

1 2	# 通过CLI删除索引 splunk remove index <index_name>

此命令删除索引的数据目录,并从 indexes.conf 中删除索引的节.
在索引器运行时运行 splunk remove index .命令完成后,无需重新启动索引器.也可以通过直接编辑 indexes.conf 并删除索引的节来删除索引.重新启动索引器,然后删除索引的目录
要从索引器集群中删除索引,必须编辑 indexes.conf 并删除索引的节.您不能使用Splunk Web或CLI.与索引器群集上的所有此类更改一样,首先在管理器节点上编辑文件,然后将更改应用于对等节点.请参阅在索引器集群中配置对等索引应用了 indexes.conf 更改并且对等节点重新启动后,请从每个对等节点中删除索引的目录.

禁用索引而不将其删除

索引一旦被禁用,索引器就不再接受针对它的数据.但是,禁用索引不会删除索引数据,并且该操作是可逆的.

在Splunk Web中禁用索引.要执行此操作,请导航到设置>索引,然后单击要禁用的索引右侧的禁用.要重新启用索引,请单击索引右侧的启用.

也可以使用CLI命令:

# 禁用索引
splunk disable index <index_name>
# 重新启用索引
splunk enable index <index_name>

要禁用索引器集群的索引,必须在索引节中编辑 indexes.conf 并设置 disabled=true .您不能使用Splunk Web或CLI.与索引器群集上的所有此类更改一样,首先在管理器节点上编辑文件,然后将更改应用于对等节点.

本文由 kill3r 原创,采用署名-非商业性使用-相同方式共享 4.0 国际许可协议，转载请注明出处。