第一届人工智能(发电产业)技能大赛 目录 一、单选题...............................................1 二、多选题..............................................76 三、判断题.............................................107 四、论述题.............................................122 培训题库 一、单选题 1. 快速排序在下列哪种情况下时间复杂度退化为O(n²)(A) A.数据完全有序 B.数据完全随机 C.使用三数取中法选择基准 D.小规模数据使用插入排序 2. 机器学习中,监督学习的核心是?(B) A.从无标签数据中学习模式 B.根据已有的标签数据建立输入到输出的映射关系 C.自动聚类数据 D.仅处理图像数据 3. 以下关于PCA(主成分分析)的描述,错误的是哪一项?(B) A.PCA 可以缓解/解决维数灾难的问题 B.PCA 的核心思想是删除相对不重要的特征 C.PCA 的思想之一是将n维特征映射到k维上(k1: print(k) k=k/2 A.9 B.10 C.11 D.100 29. 哈希表处理冲突时,下列方法可能产生"二次聚集"现象的是:(B) 第 5 页 共 140 页 A.链地址法 B.线性探测法 C.再哈希法 D.公共溢出区法 30. 下列排序算法中,最坏时间复杂度为O(nlogn)且空间复杂度为O(1)的是: (C) A.归并排序 B.快速排序 C.堆排序 D.基数排序 31. 堆排序建立初始堆的时间复杂度是:(A) A.O(n) B.O(n log n) C.O(log n) D.O(n²) 32. 以下关于隐藏层数对神经网络影响的描述,错误的是哪一项?(C) A.隐藏层越多,神经网络的分辨能力越强 B.隐藏层越多,计算成本越大 C.隐藏层越多,越容易发生欠拟合 D.隐藏层越多,越容易产生梯度消失的问题 33. 对于回归模型,以下哪个指标越接近1,说明模型拟合效果越好?(C) A.均方误差(MSE) B.平均绝对误差(MAE) C.决定系数(R²) D.准确率(Accuracy) 34. 如下场景描述的是哪一种机器学习方法:根据数据本身之间的属性对数据进 行聚类,相似相近的数据聚在同一类;不相似或不相近的数据分在不同的类中。 (B) A.监督学习 B.无监督学习 C.半监督学习 D.强化学习 35. LSTM 通过引入什么机制解决了循环神经网络中的梯度消失和梯度爆炸问 题?(A) 第 6 页 共 140 页 A.门控机制 B.池化操作 C.参数共享 D.膨胀卷积 36. 深度学习中,以下哪种优化器在训练初期收敛速度较快?(B) A.SGD(随机梯度下降) B.Adam C.Adagrad D.Adadelta 37. 关于随机森林与决策树,以下哪个说法是正确的?(B) A.随机森林只能处理分类问题,不能处理回归问题 B.决策树容易过拟合,而随机森林通过集成学习可以减少过拟合 C.随机森林中的每棵树都是完全相同的 D.决策树的准确率通常高于随机森林 38. 在大模型的训练过程中,哪个步骤需要的数据集最大?(B) A.有监督微调 B.预训练 C.强化学习 D.生成奖励模型 39. import pandas as pd dt = {'one': [9, 8, 7, 6], 'two': [3, 2, 1, 0]} a = pd.DataFrame(dt) 哪个是print(a.values)的结果?(C) A.[[9 8 7 6] [3 2 1 0]] B.[3, 2, 1, 0] C.[[9 3] [8 2] [7 1] [6 0]] D.[9, 8, 7, 6] 40. 以下关于Python说法正确的是哪一项()?(C) A.变量是对象,但函数不是对象 B.Python 面向对象编程的封装性体现在不允许私有化变量被访问,而且这样的 要求十分严格 C.Python 的多态性表现在子类可以覆盖父类的属性或方法 D.多重继承没有任何问题 41. RAG 流程中,“文档分块”的主要目的是?(B) 第 7 页 共 140 页 A.增加文档的存储容量 B.提升检索的精准度和效率 C.降低文档的可读性 D.方便文档的可视化展示 42. 以下哪种情况最适合使用RAG技术?(A) A.模型需要回答最新的行业政策问题 B.模型需要完成简单的数学计算 C.模型需要生成创意文案 D.模型需要进行语言翻译 43. “思维链(Chain-of-Thought)”提示词的核心是?(D) A.让模型直接输出答案,无需推理过程 B.要求模型使用特定的词汇 C.限制模型的输出长度 D.引导模型分步推理,展示思考过程 44. Dify 中,若需要根据用户输入的不同类型(如文本/图片)执行不同流程, 应使用哪种节点?(B) A.工具调用节点 B.条件分支节点 C.知识检索节点 D.模型调用节点 45. 以下哪项不属于提示词工程的核心原则?(A) A.提升模型的预训练效率 B.提供示例引导 C.增加冗余修饰词 D.设定清晰的输出格式 46. 在RAG流程中,用户问题首先需要被转换为什么?(B) A.文本 B.向量 C.图像 D.音频 47. 微调的核心步骤顺序正确的是?(A) A.数据准备→模型选择→配置微调参数→训练→评估 B.模型选择→数据准备→训练→配置微调参数→评估 C.数据准备→训练→模型选择→配置微调参数→评估 第 8 页 共 140 页 D.模型选择→配置微调参数→数据准备→训练→评估 48. Dify 平台主要用于以下哪项功能?(B) A.人工智能数据分析 B.Agent 流程编排 C.系统监控 D.业务需求调研 49. 若要让通用大模型适配金融领域的专业任务,最合适的方法是?(D) A.重新训练一个全新模型 B.仅通过提示词工程引导 C.增加模型的推理步数 D.使用金融领域数据集进行轻量化微调 50. Dify 平台支持的知识库文件格式不包括?(D) A.PDF B.TXT C.DOCX D.EXE 51. 提示词工程中,“零样本提示”是指?(A) A.不给模型任何示例,直接下达任务指令 B.给模型一个示例引导任务 C.给模型多个示例引导任务 D.要求模型输出零错误的结果 52. RAG 技术中,“向量检索”的核心是通过什么来匹配用户查询与文档内容? (C) A.关键词的重复次数 B.文档的发布时间 C.文本的语义相似度 D.文本的字符长度 53. 在大模型训练中,ZeRO(Zero Redundancy Optimizer)技术主要用于解决 什么问题?(C) A. 模型精度下降 B.训练数据不足 C.分布式训练中的降低了显存冗余与提高了通信开销 D.推理延迟过高 54. 以下哪种框架是构建大模型神经网络的核心预训练框架?(A) 第 9 页 共 140 页 A.PyTorch B.Pandas C.Scrapy D.vLLM 55. 有哪些方法可以处理大模型的幻觉问题?(D) A.增加训练数据 B.提高学习率 C.对模型进行量化 D.使用检索增强生成 56. 大语言模型提取文本信息能力靠什么机制实现的?(B) A.负反馈机制 B.注意力机制 C.心跳机制 D.握手机制 57. Transformer 中的位置编码(Positional Encoding)主要作用是?(D) A.减少模型参数量 B.加速模型收敛 C.减少推理延迟 D.为输入序列注入位置信息,解决自注意力机制的无序性问题 58. 大模型中的“MoE(MixtureofExperts)”架构,其核心设计思路是?(C) A.将多个小模型的输出结果加权平均 B.让模型在不同任务中自动切换不同的注意力机制 C.仅激活部分专家网络处理特定输入,平衡性能与效率 D.通过多模态数据训练,提升模型的跨领域能力 59. 以下哪项不属于多模态模型的典型输入模态?(D) A.文本 B.图像 C.音频 D.模型参数 60. Transformer 架构中,用于计算查询(Query)与键(Key)相似度的核心操 作是?(A) A.点积运算 B.矩阵分解 C.卷积计算 第 10 页 共 140 页 D.池化操作 61. 以下哪种技术不属于大模型上下文学习的应用形式?(C) A.少样本学习 B.零样本学习 C.微调 D.思维链 62. 以下哪项是提示工程的核心目标?(B) A.增加模型的参数量 B.通过优化输入指令,引导模型输出符合预期的结果 C.提升模型的训练数据质量 D.减少模型的推理时间 63. 在深度学习框架中,PyTorch和TensorFlow的主要用途是?(B) A.提供GPU驱动程序 B.构建、训练和部署神经网络模型 C.进行数据库管理 D.编写前端网页 64. 关于卷积神经网络(CNN),以下说法正确的是?(C) A.CNN 只能处理文本数据 B.CNN 通过全连接层提取局部特征 C.CNN 利用卷积核自动学习空间局部特征 D.CNN 不适用于图像任务 65. Loss Function 损失函数在训练中的作用是?(D) A.初始化训练参数 B.选择激活函数 C.减少训练层数 D.衡量预测和真实标签之间的差距 66. 在分类任务中,Softmax函数的主要作用是?(B) A.计算损失值 B.将输出转换为概率分布 C.更新网络权重 D.标准化输入特征 67. 以下哪种方法常用于防止神经网络过拟合?(C) A.增加学习率 B.使用更大的batch size 第 11 页 共 140 页 C.添加Dropout 层 D.减少训练轮数 68. 以下哪一项不是常见的激活函数?(D) A.ReLU B.Softmax C.Tanh D.Adam 69. 在机器学习中,过拟合通常的表现为?(A) A.训练误差低,测试误差高 B.训练误差高,测试误差低 C.训练和测试误差都高 D.训练和测试误差都低 70. 以下哪项技术属于智算中心“存储与网络升级”中的关键突破?(B) A.传统RAID磁盘阵列 B.基于RDMA与NVMe SSD的文件存储 C.本地SSD缓存 D.基于HTTP协议的分布式文件系统 71. 在推理优化中,以下哪项技术通过将模型权重转换为低精度(如INT8)以 提升推理效率?(A) A.量化 B.知识蒸馏 C.算子融合 D.提督检查点 72. 在大模型训练中,混合精度训练的主要优势是?(B) A.提高模型最终准确率 B.减少显存占用并加速训练 C.增加模型层数以提升表达能力 D.降低GPU功耗 73. 通过降低参数精度(如FP32转INT8)提升推理效率的技术是?(B) A.梯度下降 B.量化 C.下一句预测 D.数据爬取 74. 大模型推理阶段如何提高效率?(A) 第 12 页 共 140 页 A.使用KV Cache机制 B.增加模型层数 C.使用更大的数据集微调 D.采用交叉验证评估模型性能 75. 以下哪种技术是Transformer架构的核心创新,直接提升了模型对长序列数 据的并行处理能力?(B) A.门控循环单元 B.自注意力机制 C.循环神经网络 D.卷积神经网络 76. BERT 模型使用的预训练任务包括?(C) A.对比学习 B.自回归语言建模 C.掩码语言建模+下一句预测 D.图像文本对齐 77. 以下哪项是反向传播(Backpropagation)算法的核心?(A) A.使用链式法则计算梯度 B.加快模型训练速度 C.更可靠地评估模型性能 D.增加训练数据量 78. 以下哪种技术属于“模型架构优化”,而非训练/推理加速技术?(C) A.混合精度训练 B.FlashAttention C.MoE 混合专家 D.分布式训练 79. 以下哪种优化器在大模型训练中更常被使用?(C) A.SGD B.RMSprop C.AdamW D.Adagrad 80. 以下哪项技术属于大模型训练中的“动态负载均衡”策略?(B) A.使用固定Batch Size进行训练 B.根据任务优先级动态调整GPU资源分配 C.固定所有层的参数更新顺序 第 13 页 共 140 页 D.仅使用单机训练以简化调度 81. 在分布式训练中,以下哪种技术用于将模型参数拆分到多个GPU上以减少单 卡显存压力?(C) A.数据并行 B.流水线并行 C.模型并行 D.梯度并行 82. 在大模型高效微调方法中,LoRA(Low-Rank Adaptation)的核心思想是? (A) A.冻结原始权重,仅训练低秩分解矩阵来近似权重更新 B.完全重新训练所有模型参数以适应新任务 C.删除部分注意力头以减少计算量 D.将模型蒸馏为小型学生模型进行微调 83. 假设一个二叉树的的节点个数为50,那么它的最小高度是(D) A.4 B.5 C.9 D.6 84. 模型的高bias是什么意思,我们如何降低它?(D) A.在特征空间中减少特征 B.在特征空间中增加特征 C.增加数据点 D.B 和C选项 85. 我们想在大数据集上训练决策树,为了使用较少时间,我们可以(C) A.增加树的深度 B.增加树的数量 C.减少树的深度 D.减少树的数量 86. 以下哪些方法不可以直接来对文本分类?(A) A.Kmeans B.决策树 C.支持向量机 D.KNN 87. Hierarchical Clustering 算法的主要分割思想是?(C) 第 14 页 共 140 页 A.自下而上 B.聚类 C.自上而下 D.回归 88. Bagging 主要通过什么来降低方差(B) A.多次迭代 B.平均 C.更多数据 D.优化算法 89. svm 通过什么方法扩展到非线性边界?(B) A.多元函数 B.核函数 C.多个特征 D.多变量 90. 以下哪种不是梯度下降算法?(D) A.BGD B.MBGD C.SGD D.AGD 91. 以下哪个不属于决策树的类型是?(D) A.ID3 B.C4.5 C.CART D.C3 92. 在大数据集上训练决策树,为了使用较少时间可以(C) A.增加树的深度 B.增加树的数量 C.减少树的深度 D.减少树的数量 93. 以下哪些方法不可以直接来对文本分类?(A) A.Kmeans B.决策树 C.支持向量机 D.KNN 第 15 页 共 140 页 94. 下列选项中对泊松分布与二项分布的关系描述正确的是?(B) A.泊松分布与二项分布的数学模型都是拉格朗日概型 B.泊松分布是二项分布当n很大p很小时的近似计算 C.泊松分布与二项分布没有关系 D.泊松分布可以替代二项分布 95. 下列关于聚类挖掘技术的说法中,错误的是(B) A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别 B.要求同类数据的内容相似度尽可能小 C.要求不同类数据的内容相似度尽可能小 D.与分类挖掘技术相似的是,都是要对数据进行分类处理 96. 下列属于无监督学习的是(A) A.k-means B.SVM C.决策树 D.逻辑回归 97. 数据科学家可能会同时使用多个算法(模型)进行预测,并且最后把这些算 法的结果集成起来进行最后的预测(集成学习),以下对集成学习说法正确的是 (B) A.单个模型之间有高相关性 B.单个模型之间有低相关性 C.在集成学习中使用“平均权重”一定比“投票”会比较好 D.单个模型都是用的一个算法 98. 下面对集成学习模型中的弱学习者描述错误的是?(C) A.他们经常不会过拟合 B.他们通常带有高偏差,所以其并不能解决复杂学习问题 C.他们通常会过拟合 D.其模型效果往往比一般的简单算法要好 99. 以下哪一个不是数据清理中空值的处理方式(D) A.均值填充 B.中位数填充 C.直接删除 D.不用管 100. 关于Python的应用领域,下列哪种说法是错误的?(B) A.Python 可以用于开发网站 第 16 页 共 140 页 B.Python 是一种简单低效的教学语言,一般只用于产品的原型实现 C.Python 广泛应用于自动化运维领域 D.Python 广泛应用于数据分析领域,包括金融,生物,电商等 101. 关于Python在数据分析方面的应用,下列说法错误的是?(B) A.Pandas 是 Python 用于数据分析的重要模块 B.Pandas 模块包含了多种神经网络算法 C.Numpy 模块提供了对数组的高性能处理功能 D.SciKit-Learn(sklearn)模块包含了多种机器学习算法 102. 在Python 开发中,找到a的最大值b的程序语句是?其中 a=np.random.random(30)(A) A.b=a.max() B.b=a.min() C.b=a.sum() D.b=a.mean() 103. 在Python 开发中,下列哪个模块用于随机数运算(A) A.random B.math C.float D.int 104. 关于Python语言,如下那个方法可以查看DataFrame变量df前10行内容? (B) A.df.head(1) B.df.head(10) C.df.line(10) D.df.output(10) 105. 哪种Python内置函数,用来返回序列中的最大元素?(B) A.len() B.max() C.min() D.sum() 106. 关于Python语言,以下代码中哪个是正确的while循环语句是?(B) A.while loop a<10 B.while a<10: C.while(a<10) 第 17 页 共 140 页 D.while loop a<10: 107. 关于Python语言,代码def a(b,c,d):pass含义是?(B) A.定义一个列表,并初始化它 B.定义一个函数,但什么都不做 C.定义一个函数,并传递参数 D.定义一个空的类 108. 关于python语言以下说法正确的一项是(D) A.不定长参数*args可用于传入关键词参数 B.默认参数必须放到参数列表的末位 C.在lambda 函数定义时全都没有定义参数 D.lambda 表达式中可以使用for,if或print语句 109. Python 中,以下哪个变量的赋值是正确的?(C) A.var a=2 B.int a=2 C.a=2 D.variable a=2 110. 以下关于Python的描述错误的是?(A) A.Python 的语法类似PHP B.Python 可用于WEB开发 C.Python 是跨平台的 D.Python 可用于数据抓取(爬虫) 111. 如下哪个语句能够生成一个n*n的正方形矩阵,对角线值为1,其余位置 值为0(B) A.np.zeros((n,n)) B.np.eye(n) C.np.full((n,n),1) D.np.ones((n,n)) 112. 下面关于Series和DataFrame的理解,哪个是不正确的?(B) A.DataFrame 表示带索引的二维数据 B.Series 和 DataFrame 之间不能进行运算 C.Series 表示带索引的一维数据 D.可以像对待单一数据一样对待Series和DataFrame对象 113. 回归算法预测的标签是?(B) A.离散型 第 18 页 共 140 页 B.连续型 C.自变型 D.应变型 114. 在对抗生成网络当中,带有标签的数据应该被放入哪里?(B) A.作为判别模型的输出值 B.作为判别模型的输入值 C.作为生成模型的输入值 D.作为生成模型的输出值 115. 关于Python的语法结构,下列哪种说法是错误的?(B) A.Python 的命名可以由数字和大小写英文以及下划线组成,其中数字不能作为 变量的开头使用 B.Python 的集合(set)是一个有序的不重复的元素集合,不能放入相同的元素是 其最大的特点之一 C.Set 和 dict 的唯一区别在于没有存储对应值的value D.如果我们需要引入第三方模块,导入一个包的关键字是import 116. 列表、元组、字符串是Python的什么序列?(C) A.无序 B.时间 C.有序 D.空间 117. 下面哪一个不是Python的数据类型?(D) A.列表 B.字典 C.元组 D.类 118. 避免过拟合的方法是(D) A.模型复杂度过低,不能很好的拟合所有的数据,训练误差大 B.增加模型复杂度,如采用高阶模型(预测)或者引入更多特征(分类)等 C.模型复杂度过高,训练数据过少,训练误差小,测试误差大 D.降低模型复杂度,如加上正则惩罚项,如L1,L2,增加训练数据等 119. 下列正则表达式中,()用于匹配除换行符外的任意字符(A) A.. B.^ C.$ 第 19 页 共 140 页 D.? 120. 以下哪个激活函数可以很好的解决梯度消失问题?(A) A.Relu B.Sigmoid C.Tanh D.Softsign 121. 为了观察测试Y与X之间的线性关系,X是连续变量,使用下列哪种图形 比较适合(A) A.散点图 B.柱形图 C.直方图 D.以上都不对 122. 什么是KDD?(A) A.数据中的知识发现 B.领域知识发现 C.文档知识发现 D.动态知识发现 123. 以下哪个选项不是参数估计的评价指标?(D) A.无偏性 B.有效性 C.一致性 D.自适性 124. 向量x=[1,2,3,4,-9,0]的 L1 范数是多少?(B) A.1 B.19 C.6 D.sqrt(111) 125. 二分问题时,当训练集是线性可分的情况下,svm可以用什么进行分类(B) A.软间隔 B.硬间隔 C.核函数 D.张量 126. K-means Clustering 算法的 k 值如何选取的?(B) A.随机 第 20 页 共 140 页 B.人工 C.计算机自动识别 D.已知 127. AI 的英文缩写是?(B) A.Automatic Intelligence B.Artifical Intelligence C.Automatic Information D.Artifical Information 128. 不属于深度学习开发框架的是?(C) A.CNTK B.Keras C.BAFA D.MXNet 129. 构建一个神经网络,将前一层的输出和它自身作为输入,下列哪一种架构 有反馈连接?(A) A.循环神经网络 B.卷积神经网络 C.限制玻尔兹曼机 D.都不是 130. 对于图像识别问题(比如识别照片中的猫),神经网络模型结构更适合解 决哪类问题?(B) A.多层感知器 B.卷积神经网络 C.循环神经网络 D.感知器 131. 对于分类任务,我们不是将神经网络中的随机权重初始化,而是将所有权 重设为零。下列哪项是正确的?(B) A.没有任何问题,神经网络模型将正常训练 B.神经网络模型可以训练,但所有的神经元最终将识别同样的事情 C.神经网络模型不会进行训练,因为没有净梯度变化 D.这些均不会发生 132. 梯度下降算法的正确步骤是什么?(D) 1.计算预测值和真实值之间的误差 2.迭代跟新,直到找到最佳权重 第 21 页 共 140 页 3.把输入传入网络,得到输出值 4.初始化随机权重和偏差 5.对每一个产生误差的神经元,改变相应的(权重)值以减小误差 A.1,2,3,4,5 B.5,4,3,2,1 C.3,2,1,5,4 D.4,3,1,5,2 133. 训练神经网络过程中,损失函数在一些时期(Epoch)不再减小,原因可能 是:(D) 1.学习率(Learning rate)太低 2.正则参数太大 3.卡在了局部最小值 A.1&2 B.2&3 C.1&3 D.都有可能 134. 神经网络由许多神经元(Neuron)组成,每个神经元接受一个输入,处理 它并给出一个输出。这里是一个真实的神经元的图解表示。下列关于神经元的陈 述中哪一个是正确的?(D) A.一个神经元有多个输入和多个输出 B.一个神经元有多个输入和一个输出 C.一个神经元有一个输入和多个输出 D.上述都正确 135. 在人工智能的算法层,以下哪些不是人工智能的算法分类。(D) A.有监督学习 B.无监督学习 C.强化学习 D.自主学习 136. 在一个神经网络里,知道每一个神经元的权重和偏差是最重要的一步。如 果以某种方法知道了神经元准确的权重和偏差,你就可以近似任何函数。实现这 个最佳的办法是什么?(C) A.随机赋值,祈祷它们是正确的 B.搜索所有权重和偏差的组合,直到得到最佳值 C.赋予一个初始值,通过检查跟最佳值的差值,然后迭代更新权重 第 22 页 共 140 页 D.以上都不正确 137. 在神经网络中,以下哪种技术用于解决过拟合?(D) A.Dropout B.正则化 C.批规范化 D.以上说法都对 138. 如果使用线性回归模型,下列说法正确的是?(A) A.检查异常值是很重要的,因为线性回归对离群效应很敏感 B.线性回归分析要求所有变量特征都必须具有正态分布 C.线性回归假设数据中基本没有多重共线性 D.以上说法都不对 139. 小批量梯度下降中的小批量体现在(A) A.每次参数迭代时都使用从数据集抽出一部分进行训练 B.每次参数迭代时都使用从特征中抽出一部分进行训练 C.每次参数迭代时都使用从误差中抽出一部分进行训练 D.每次参数迭代时都使用从超参数中抽出一部分进行训练 140. 欠拟合的原因是(A) A.模型复杂度过低,不能很好的拟合所有的数据,训练误差大 B.增加模型复杂度,如采用高阶模型(预测)或者引入更多特征(分类)等 C.模型复杂度过高,训练数据过少,训练误差小,测试误差大 D.降低模型复杂度,如加上正则惩罚项,如L1,L2,增加训练数据等 141. 以下关于机器学习描述正确的是?(A) A.深度学习是机器学习的一个分支 B.深度学习与机器学习是互相包含的关系 C.深度学习与机器学习同属于人工智能但相互之间没有关系 D.以上都不对 142. 下列不是属性类型的是(B) A.标称属性 B.自反属性 C.序数属性 D.数值属性 143. 关于L1正则化与L2正则化以下表述正确的是?(A) A.L1 正则项有利于模型的泛化能力 B.L2 正则化比L1正则化产生更加稀疏的模型 第 23 页 共 140 页 C.L1,L2 正则项不能作用在损失函数之上的 D.加上L2正则项后,无法使用梯度下降算法迭代参数值 144. 在监督学习中,训练数据包含(C) A.只有输入特征 B.只有输出标签 C.输入特征和输出标签 D.既没有输入特征也没有输出标签 145. 某数据库中有三次交易,分别为物品A,B;物品B,D,物品A,D,请问物品A->B 的z置信度是多少?(D) A.1 B.0.1 C.0.3 D.0.5 146. 下列哪项不属于大模型技术栈中的“对齐”技术?(C) A.RLHF B.DPO C.FlashAttention D.GRPO 147. 以下哪种工具可以用于文本、图像等数据标注工作?(A) A.Label Studio B.Docker C.TensorBoard D.MySQL 148. LoRA 技术主要用于?(C) A.模型压缩 B.超参数搜索 C.大语言模型高效微调 D.数据增强 149. 以下哪种优化策略主要用于缓解大模型训练中的梯度消失问题?(B) A.随机失活 B.层归一化 C.权重衰减 D.学习率预热 150. 关于表说法错误的是(D) 第 24 页 共 140 页 A.单链表删除某一节点必须找到其前驱节点 B.双链表中每个节点存在两个指针,一个指向前驱节点,一个指向后继节点 C.顺序表通过下标表示元素间的联系 D.线性表的顺序结构中插入或删除元素需要移动N个元素,移动数据元素的个数 与位置无关 151. 以下那个不能作为分类算法?(D) A.GBDT B.PNN C.LightGBM D.apriori 152. 下列哪种方法能适合于用作特征选择?(B) A.KNN B.RandomForest C.SVM D.Kmeans 153. 一般,k-NN最近邻方法在()的情况下效果较好。(C) A.样本较多但典型性不好 B.样本较少但典型性好 C.样本呈团状分布 D.样本呈链状分布 154. 关于Python语言,代码L=[1,23,"runoob",1]输出的数据类型是?(A) A.列表 B.字典 C.元组 D.类 155. 常见典型异常不包括(D) A.ZeroDivisionError B.ValueError C.IndexError D.NotIntError 156. 某数据库中有三次交易,分别为物品A,B;物品B,D,物品A,D,请问物品A 的支持度是多少?(B) A.1 B.2 第 25 页 共 140 页 C.3 D.4 157. 假设你需要改变参数来最小化代价函数(costfunction),可以使用下列 哪项技术?(D) A.穷举搜索 B.随机搜索 C.Bayesian 优化 D.以上任意一种 158. 想要让大模型在输出时优先选择概率最高的前N个词,应调整哪个参数? (D) A.temperature B.top p C.学习率 D.top k 159. Dify 平台中chatflow的LLM节点的主要功能是?(B) A.为后续工作流节点以及应用的正常流转提供必要的初始信息 B.调用大模型的能力,根据给定的提示词处理广泛的任务类型 C.从知识库中检索与用户问题相关的文本内容 D.对用户问题进行分类 160. LoRA 技术主要用于?(C) A.模型压缩 B.超参数搜索 C.大语言模型高效微调 D.数据增强 161. 以下哪项不属于智算中心的关键技术?(D) A.异构计算 B.高速互联网络 C.分布式存储系统 D.区块链共识机制 162. 以下哪项是Hugging Face Transformers库的主要功能?(C) A.提供GPU驱动程序优化 B.实现分布式文件系统管理 C.加载、训练和推理预训练语言模型(如BERT、GPT、LLaMA) D.自动生成Python数据清洗脚本 第 26 页 共 140 页 163. 大模型推理中常用的vLLM框架主要通过哪种技术提升吞吐量?(B) A.梯度检查点(Gradient Checkpointing) B.PagedAttention 内存管理机制 C.数据并行训练策略 D.自监督对比学习 164. 根据图表选用原则,对比不同产品类别的销售额大小时,最适用的图表类型 是?(B) A.折线图 B.柱状图 C.饼图 D.散点图 165. 在制作仪表板时,将多个分析图表(如公司概览、趋势分析、地域分布)组织 在一起,主要是为了?(B) A.展示更多的图表类型 B.在一页内综合呈现多角度的业务洞察,方便决策 C.减少数据处理的步骤 D.符合公司的汇报模板 166. 当分析“不同产品线的利润率”时,“产品线”在分析中扮演的角色是?(B) A.度量 B.维度 C.指标 D.结论 167. 在公式中,引用单元格A1到A10区域,正确的表示是?(B)。 A.A1-A10 B.A1:A10 C.A1;A10 D.A1,A10 168. 以下关于优化器的说法正确的是?(A) A.SGD,MBGD,动量优化器的共同特点是每次迭代都用相同学习率进行更新 B.动量优化器的学习率不需要手动设置 C.Adam 优化器与Adagrad优化器没有联系 D.Adagrad 优化器学习率 第 27 页 共 140 页 169. 不是自动更新的要分析“每个区域的年度总发电量”,在创建组件时,应对 “发电量”字段进行哪种聚合计算?(B) A.平均值 B.求和 C.计数 D.方差 170. DEF 函数的语法为DEF(指标,[维度1,维度2],[过滤条件]),其中[维度1, 维度2]的作用是?(B) A.定义计算指标时的过滤范围 B.定义指标计算时的分组依据 C.定义指标的聚合方式 D.定义结果的排序方式 171. 展示一个指标(如网站访问量)随时间(如月份)连续变化的趋势,最适用的 图表类型是?(B) A.饼图 B.折线图 C.漏斗图 D.矩形树图 172. 使用“参数”功能(如下拉列表选择月份)的主要优势是?(B) A.永久改变数据源的数值 B.让用户能动态交互,灵活切换分析视角 C.提高数据计算的速度 D.自动美化图表 173. 对于数据条目非常多(如分析全国20个省份的发电量占比)的分类对比,使 用饼图可能的主要问题是什么?(B) A.无法显示趋势 B.切片过多导致难以区分和阅读 C.不能显示具体数值 D.计算速度慢 174. 以下哪项功能通常不会改变原始数据表的结构(如增加/减少物理列)?(D) A.新增公式列 B.分组汇总 C.行转列 D.字段设置(如修改字段名) 第 28 页 共 140 页 175. 在数据准备阶段,发现“年龄”字段中存在“-1”或“20”等明显不合理值, 最好使用什么功能进行处理?(B) A.删除重复行 B.新增公式列配合IF函数进行替换或标记 C.行转列 D.直接手动修改 176. 当需要展示的数据维度较多(如年份、类别、地区),但又希望图表保持简洁 时,以下哪种方法不合适?(A) A.使用“细粒度”组件,将多个维度拖入图形属性 B.使用“分组表”组件,将维度分别放入行、列 C.创建多个图表,每个图表聚焦1-2个维度 D.使用“交叉表”组件 177. 想要在仪表板顶部添加一个文本组件,用于动态显示当前筛选条件下的总 销售额,应该使用什么类型的字段?(B) A.维度字段 B.指标字段(度量) C.参数 D.分组字段 178. 使用DEF_COUNT 函数时,其通常用于对什么进行计数?(B) A.数值字段的和 B.满足条件的记录行数 C.文本字段的字符数 D.日期字段的天数差 179. 当数据表中的“金额”字段是以文本类型存储的数字(如“1,000”)时,要 对其进行求和计算,首先需要进行什么操作?(B) A.直接拖入组件作为指标 B.使用“新增公式列”并利用函数将其转换为数值类型 C.进行数据过滤 D.使用分组汇总 180. 如果希望柱状图中每个柱子的颜色根据其代表的“产品类别”自动区分, 应该将“产品类别”字段拖拽到图形属性的哪个区域?(C) A.横轴 B.纵轴 C.颜色 第 29 页 共 140 页 D.大小 181. 在分析组件中,对日期字段进行“按周”或“按旬”的分组,通常在哪里设 置?(B) A.数据模块的字段类型设置 B.组件中,对该日期字段进行“分组”设置 C.使用新增公式列计算周数 D.在过滤条件中指定 182. 当仪表板中的图表加载速度很慢时,以下哪种做法通常不能有效提升性 能?(B) A.在数据模块对大数据集进行提前的聚合汇总 B.在组件中增加更多的计算指标和维度 C.检查并优化数据关联关系,避免多对多关联 D.对日期等常用筛选字段创建索引(如果数据源支持) 183. 想要实现“当销售额大于10万时,表格中的单元格显示红色;否则显示绿 色”的效果,应使用什么功能?(B) A.图表颜色设置 B.条件格式 C.新增公式列 D.过滤条件 184. 在制作仪表板时,希望某个图表只显示“近3个月”的数据,且该时间范围 能自动更新,应设置什么过滤条件?(B) A.固定日期范围过滤 B.相对日期过滤(如“最近3个月”) C.参数过滤 D.手动筛选后保存 185. 以下哪种情况最适合使用“矩形树图”?(C) A.展示时间趋势 B.对比不同类别的数值大小 C.展示层级结构数据的占比关系(如能源分类发电量占比) D.分析两个变量的相关性 186. 在仪表板中添加“下拉框参数”后,想要让参数选择后立即生效,无需点击 “查询”按钮,应在参数设置中开启什么功能?(B) A.实时刷新 B.自动提交 第 30 页 共 140 页 C.联动筛选 D.默认值 187. 想要在图表中显示每个数据点的具体数值,应设置什么属性?(B) A.颜色 B.数据标签 C.图例 D.坐标轴 188. 在制作发电量分析仪表板时,希望突出显示“发电量排名前三的企业”,应 使用什么功能?(A) A.过滤条件(Top N筛选) B.排序功能 C.条件格式 D.参数控件 189. 数据分析的起点和核心是?(C) A.收集尽可能多的数据 B.使用最复杂的分析模型 C.明确分析目标和要解决的业务问题 D.制作精美的可视化图表 190. 数据分析的“四要素”不包括以下哪一项?(C) A.目的 B.数据 C.算法 D.结论 191. 在分析“本月发电量下降”的原因时,从“公司总发电量”深入到“西南区 西南区域发电量”,再深入到“某电站发电量”,这种分析方法被称为?(B) A.数据关联 B.数据下钻 C.数据预测 D.数据对比 192. 以下哪个场景最适合使用“对比分析”?(B) A.预测下个季度的产品销量 B.评估本月实际销售额与预算目标的差距 C.将客户按照购买金额进行分组 D.计算公司员工的平均年龄 第 31 页 共 140 页 193. 一份数据分析报告的价值,最终体现在?(C) A.报告使用了多少种图表类型 B.报告页数是否足够多 C.报告结论是否清晰,并能转化为可执行的业务建议 D.报告是否包含了所有的原始数据 194. 当发现数据中存在一个异常极高的数值(如某日发电量是平均值的100倍), 首先应该?(C) A.立即删除该数据,以免影响整体分析结果 B.忽略它,继续分析其他数据 C.识别该异常值,并分析其产生的原因(如大单、数据录入错误) D.将其修改为平均值 195. 在向非技术背景的业务部门汇报分析结果时,应该?(C) A.重点讲解所使用的复杂模型和算法原理 B.直接展示原始数据表格和SQL查询语句 C.使用业务语言解读数据含义,聚焦结论和建议 D.展示所有分析过程中生成的图表 196. 以下哪项是描述数据“趋势”最直观的方法?(C) A.计算数据的平均值和标准差 B.使用饼图展示各部分的占比 C.使用折线图观察数据随时间的变化 D.使用散点图分析两个变量间的关系 197. 数据分析中“归因分析”的主要目的是?(C) A.对数据进行分类 B.预测未来的数据值 C.找出导致某一结果或现象发生的关键原因 D.比较两组数据的差异 198. 以下哪项不属于数据分析师应具备的核心思维或品质?(C) A.刨根问底,探究数据背后的业务真相 B.严谨负责,确保数据准确和分析逻辑可靠 C.主观臆断,用个人经验代替数据分析 D.逻辑清晰,能够构建合理的分析框架 199. 进行经营分析时,与“行业标杆企业”进行对比,这种对比属于?(B) A.内部对比 B.外部对比 第 32 页 共 140 页 C.目标对比 D.趋势对比 200. 数据分析流程中,在“明确分析目的”之后,通常紧接着的步骤是?(C) A.撰写分析报告 B.数据可视化 C.数据收集与清洗 D.建立复杂的预测模型 201. 在评估一个数据分析项目是否成功时,最重要的标准是?(C) A.是否使用了人工智能算法 B.项目耗时是否足够短 C.分析结果是否解决了初始定义的业务问题 D.产生的图表是否足够美观 202. 数据分析中“监控性分析”的主要目的是?(B) A.预测未来业绩 B.实时或定期跟踪核心指标的状态,及时发现异常 C.深入诊断问题产生的根本原因 D.描述历史数据的整体情况 203. 当业务部门提出“我想知道为什么上个月的活跃用户数下降了”时,这个需 求属于数据分析五个层次中的哪一层?(C) A.是什么(描述性分析) B.有问题(监控性分析) C.为什么(诊断性分析) D.将怎样(预测性分析) 204. 在分析“客户满意度”时,除了内部的调查数据,还参考了行业报告和竞争 对手的公开信息,这体现了哪种分析思路?(B) A.趋势分析 B.内外部对比分析 C.下钻分析 D.相关性分析 205. 数据分析中常见的误区“忽略分析目的”,可能导致的最直接后果是?(B) A.数据处理速度变慢 B.分析结论与业务需求脱节,无法解决实际问题 C.图表颜色不够美观 D.使用的分析模型过于简单 第 33 页 共 140 页 206. 在数据分析项目中,耗时最长的阶段通常是?(B) A.数据可视化与报告撰写 B.数据收集、清洗和整理 C.应用高级统计模型进行分析 D.向管理层汇报 207. 当业务方对数据分析结论提出质疑时,数据分析师最专业的应对方式 是?(B) A.坚持自己的结论,因为数据不会说谎 B.重新检查数据来源、处理过程和分析逻辑,并与业务方沟通其质疑的依据 C.将质疑推给数据提供部门 D.立即按照业务方的意见修改结论 208. “通过分析用户行为序列数据,构建模型预测哪些用户可能在未来一周内 流失”,这属于数据分析五个层次中的哪一层?(D) A.是什么 B.有问题 C.为什么 D.将怎样 209. 数据分析中“逻辑分析”能力主要强调?(B) A.编程代码写得又快又好 B.能够构建从问题到结论的清晰、合理的推理链条 C.记忆力强,能记住所有数据 D.擅长制作复杂的图表 210. 数据分析师在项目开始前,与业务方充分沟通并确认“分析成功的关键标准 是什么”,这主要是在明确?(C) A.项目预算 B.数据来源 C.分析的可交付成果和验收标准 D.使用的软件工具 211. 在分析公司各部门的差旅费用时,除了总额,还应分析人均费用、费用构成 (交通、住宿、餐饮)等,这体现了哪种分析思路?(B) A.趋势分析 B.多维分解分析 C.预测分析 D.相关性分析 第 34 页 共 140 页 212. 数据分析项目中,“数据验证”环节通常发生在?(B) A.项目启动之前 B.数据清洗之后,正式分析之前 C.报告提交之后 D.只在发现错误时才进行 213. 以下哪项是衡量数据分析师“严谨负责”品质的直接体现?(B) A.报告交付速度最快 B.在报告中对数据的局限性、分析假设做出明确说明 C.承诺分析结果100%准确 D.只使用最先进的分析算法 214. 在 OKR 模型中,O(Objective)指的是什么?(B) A.具体的、可衡量的数字目标 B.定性的、鼓舞人心的方向性目标 C.执行的具体任务清单 D.关键的风险点 215. 在OKR模型中,KR(Key Results)指的是什么?(B) A.实现目标所采取的策略 B.定量的、可衡量的关键成果 C.主要的风险和障碍 D.相关的支持部门 216. 以下哪个例子最符合一个KR(关键成果)的描述?(C) A.提升市场份额 B.推出新一代产品 C.用户满意度调研得分提升至90分以上 D.优化客户服务流程 217. OSM 模型中的S(Strategy)指的是什么?(B) A.要达成的目标 B.为实现目标而采取的策略 C.衡量策略是否成功的具体指标 D.项目的总结报告 218. OSM 模型中的M(Measure)指的是什么?(C) A.要达成的最终成果 B.为实现目标而采取的策略 C.衡量策略是否成功的具体指标 第 35 页 共 140 页 D.项目的管理计划 219. 在"指标五要素"(时间,维度,度量,条件,标准)中,"销售额>100万"里的 ">100 万"属于?(D) A.时间维度 B.度量 C.条件 D.标准 220. 在指标五要素中,"华北地区"通常属于哪个要素?(B) A.时间维度 B.业务维度 C.度量 D.条件 221. 在数据分析中,北极星指标通常是指?(C) A.财务部门最重要的指标 B.唯一需要关注的指标 C.最能体现产品/业务核心价值的单一关键指标 D.最容易实现增长的指标 222. 以下哪项是拆解北极星指标的常用方法?(B) A.随机挑选几个相关指标 B.用户旅程漏斗拆解 C.只看指标本身,不做拆解 D.凭个人经验猜测 223. 数据分析的起点通常是?(B) A.寻找最复杂的模型 B.明确分析目标和要解决的业务问题 C.收集所有能拿到手的数据 D.制作可视化图表 224. 在对比分析中,与目标值对比的目的是?(B) A.让图表看起来更丰富 B.衡量实际表现与预期之间的差距 C.计算数据的平均值 D.进行数据预测 第 36 页 共 140 页 225. 对数据进行下钻分析通常是为了?(A) A.从汇总数据深入到更细的维度查找原因 B.将不同表的数据合并 C.提高数据的精度 D.对数据进行加密 226. 以下哪项更可能是一个有效的、可衡量的监控指标?(B) A.提高客户满意度 B.报销处理平均时长 C.加强团队建设 D.推动数字化转型 227. 在构建经营分析看板时,选择监控指标的原则是?(B) A.越多越好,全面覆盖 B.与核心业务目标强相关,是关键驱动指标 C.选择最容易获取数据的指标 D.选择领导最近提到过的词 228. 当数据中存在异常高或低的极端值时,在分析时应该?(C) A.直接删除,避免影响整体分析 B.忽略不管,继续分析 C.识别并分析其产生的原因,判断是否属于正常波动 D.修改为平均值 229. 在向业务部门汇报数据分析结果时,应该?(C) A.直接展示原始数据表格 B.专注于讲解使用的技术模型 C.用业务语言解读数据含义,聚焦于结论和建议 D.展示所有做过的分析图表 230. 以下哪个是描述趋势的常见方法?(B) A.计算平均数 B.使用折线图观察数据随时间的变化 C.制作饼图看构成 D.进行数据关联 231. 对数据分析师而言,懂业务的根本价值在于?(B) A.能和业务人员聊天 B.能确保分析结果贴合实际,并能解决真正的业务问题 C.能自己处理所有业务操作 第 37 页 共 140 页 D.能获得更高的职位 232. 将目标拆解为策略和衡量指标,是哪个模型的核心思想?(C) A.PEST 模型 B.SWOT 模型 C.OSM 模型 D.漏斗模型 233. 指标"2024 年第一季度华东地区线上渠道的销售额(以已回款计算)超过 5000 万"中,"线上渠道"属于哪个要素?(B) A.时间维度 B.业务维度 C.度量 D.条件 234. 对于一个电商产品,以下哪个最有可能被选为北极星指标?(B) A.网站日活跃用户数(DAU) B.总交易额(GMV) C.市场费用占比 D.服务器宕机时间 235. 以下哪项不属于指标五要素的内容?(C) A.时间 B.维度 C.算法 D.标准 236. 数据分析思维的核心不包括以下哪项?(B) A.基于事实和数据做决策 B.用工具操作替代逻辑分析 C.系统性拆解业务问题 D.持续验证和迭代假设 237. 在对比分析中,与行业标杆对比的主要目的是?(B) A.填充报告内容 B.定位自身在市场中的相对位置 C.计算绝对数值差异 D.复制标杆的所有做法 第 38 页 共 140 页 238. 以下哪种思维方式体现了数据分析的系统性?(B) A.只关注单个指标的波动 B.将业务问题拆解为多个关联的子问题 C.凭直觉判断数据异常 D.忽略数据之间的因果关系 239. 设定北极星指标时,应遵循的原则不包括?(C) A.与核心价值强相关 B.可衡量、可追踪 C.越多越好,全面覆盖 D.相对稳定,不频繁变更 240. 在OSM 模型中,如果目标(O)是提升产品使用率,以下哪项最适合作为度量 (M)?(B) A.优化产品核心功能 B.周活跃用户数(WAU)增长率 C.发布产品使用教程 D.扩大市场推广范围 241. 数据分析中假设验证思维的核心是?(B) A.坚持初始假设不改变 B.基于数据验证假设的真伪 C.无需假设直接分析数据 D.用假设替代数据 242. 以下哪项是指标口径统一的重要性体现?(B) A.让指标看起来更复杂 B.确保不同时期、不同部门的数据可比 C.增加数据收集难度 D.减少指标数量 243. 数据分析师在面对模糊的业务需求时,首先应做的是?(B) A.直接开始收集数据 B.将模糊需求拆解为具体、可分析的问题 C.制作复杂的可视化图表 D.应用高级统计模型 第 39 页 共 140 页 244. 以下哪项属于归因分析的核心目的?(C) A.描述数据的现状 B.预测未来数据趋势 C.找出导致结果的关键驱动因素 D.比较不同数据的差异 245. 在构建指标体系时,以下哪项体现了层级化思维?(B) A.所有指标杂乱堆砌 B.按目标-维度-指标分层设计 C.只设置顶层指标 D.指标之间无关联 246. 以下哪项是数据驱动决策与经验驱动决策的本质区别?(B) A.是否使用图表 B.是否基于客观数据和事实 C.是否需要业务知识 D.是否使用复杂工具 247. 在数据分析中,避免幸存者偏差的关键是?(B) A.只分析成功案例 B.全面考虑所有样本,包括失败案例 C.忽略异常数据 D.缩小分析范围 248. 以下哪项不属于数据分析的三大核心思维?(C) A.对比思维 B.归因思维 C.工具思维 D.拆解思维 249. 设定OKR时,KR的数量通常建议控制在多少个?(B) A.1 个以内 B.2-5 个 C.10 个以上 D.越多越好 250. 在指标设计中,可操作性指的是?(B) A.指标能被准确测量和计算 B.指标能指导具体的业务行动 C.指标口径简单易懂 第 40 页 共 140 页 D.指标数据容易获取 251. 以下哪项体现了数据分析的迭代思维?(B) A.一次分析得出最终结论 B.基于初步结论持续优化分析方向 C.忽略分析过程中的问题 D.坚持初始分析框架不变 252. 在OSM模型中,策略(S)的设计应紧扣哪个要素?(A) A.目标(O) B.度量(M) C.数据来源 D.工具选择 253. 以下哪项是北极星指标与辅助指标的关系?(B) A.辅助指标替代北极星指标 B.辅助指标支撑北极星指标的达成 C.两者无关联 D.北极星指标是辅助指标的子集 254. 数据分析中对比思维的核心是?(B) A.找相同点 B.找差异点 C.只对比绝对数值 D.无需参照系直接对比 255. 在拆解北极星指标时,以下哪种方法属于公式拆解法?(C) A.按用户旅程拆分 B.按业务部门拆分 C.收入=用户数×付费率×客单价 D.按地理区域拆分 256. 数据分析思维强调用数据说话,但不包括以下哪项?(B) A.尊重数据事实 B.忽略业务背景盲目相信数据 C.结合业务解读数据 D.识别数据局限性 257. 在OKR管理中,以下哪项是O和KR的关系?(B) A.O 是 KR 的具体行动 B.KR 是 O 的量化支撑 第 41 页 共 140 页 C.O 和 KR 无关联 D.KR 是 O 的目标方向 258. 以下哪项是数据分析思维的终极目标?(B) A.制作精美的图表 B.支持业务决策,创造价值 C.收集更多的数据 D.使用复杂的模型 259. 权限组管理中,数据权限主要控制什么?(B)。 A.用户能看到哪些应用和表单 B.用户能对表单数据进行查看、编辑、删除等操作的范围 C.用户能使用哪些表单功能按钮 D.用户能否管理流程 260. 视图功能的主要作用是?(B)。 A.创建新的数据表 B.对同一张表单的数据提供不同的筛选、排序和显示方案 C.设计表单界面 D.配置流程节点 261. 在表单设计时,希望单价和数量字段填写后,金额字段自动计算并显示,但 禁止用户直接修改金额,应如何设置?(A)。 A.对金额字段使用公式编辑,并勾选不允许手动编辑 B.对金额字段设置数据联动 C.对金额字段设置字段校验 D.使用智能助手来计算金额 262. 流水号字段的典型用途是?(B)。 A.记录创建时间 B.生成唯一的单据编号,如PO-20250313-001 C.自动计算数字总和 D.关联其他表单 263. 希望用户提交表单后,立即收到一条微信通知,应配置哪个功能?(B)。 A.数据联动 B.推送提醒 C.默认值 D.字段校验 第 42 页 共 140 页 264. 在数据工厂中,想要计算每个产品的平均售价,应该使用哪个节点对销售记 录表进行处理?(C)。 A.横向连接 B.追加合并 C.分组汇总 D.字段设置 265. 子表单字段适合用于以下哪种场景?(B)。 A.填写申请人的单一信息 B.记录一条订单中的多个商品明细 C.选择审批部门 D.上传单个文件 266. 在流程节点属性中,操作按钮设置不包含以下哪项?(D)。 A.同意 B.拒绝 C.提交 D.打印 267. 关联数据字段与关联查询字段的关键区别是?(A)。 A.关联数据可以选择多条记录并带回其字段值到当前表单;关联查询仅用于查看 B.关联数据只能查看,关联查询可以编辑 C.关联数据不需要设置关联条件 D.关联数据只能用于流程表单 268. 设置日期时间字段的默认值为提交时间,这意味着?(B)。 A.表单打开时自动显示当前时间 B.用户点击提交按钮的那一刻,时间被记录 C.流程结束时记录时间 D.由审批人手动填写时间 269. 希望采购申请单的总金额超过10万元时,必须由总经理审批,否则只需部 门经理审批,应如何设计流程?(B)。 A.设置两个平行的审批节点 B.使用条件分支节点,根据总金额字段的值决定流程走向 C.让发起人自己选择审批人 D.无法实现,必须固定流程 第 43 页 共 140 页 270. 数据管理页面中,不能直接进行以下哪项操作?(C)。 A.查看所有表单数据 B.批量删除数据 C.修改表单的字段设计 D.导出数据到Excel 271. 仪表盘中图表的数据来源可以是?(C)。 A.只能是聚合表 B.只能是数据工厂输出表 C.可以是任意表单、聚合表或数据工厂输出表 D.只能来自同一张表单 272. 为了防止用户重复提交相同内容的表单,可以设置什么?(B)。 A.字段校验 B.提交校验 C.推送提醒 D.打印模板 273. 在权限组中,设置某用户对表单拥有管理全部数据权限,这意味着该用户可 以?(B)。 A.只能查看所有数据 B.可以查看、编辑、删除所有数据,并能管理流程(如强制归档) C.可以设计表单字段 D.可以配置系统参数 274. 数据工厂的字段设置节点,不能实现以下哪项功能?(D)。 A.重命名字段 B.修改字段类型(如文本转数字) C.基于已有字段使用公式计算新字段 D.删除其他表单的数据 275. 在流程表单中,希望审批人驳回时,必须填写驳回原因,应如何设置?(A) A.在节点属性中,为驳回按钮设置填写意见为必填 B.在表单中增加一个驳回原因字段,并设置为必填 C.无法强制要求填写原因 D.使用推送提醒通知发起人 276. 部门单选字段选中的值,在数据工厂或公式中,通常以什么形式存在?(B) A.部门名称文本 B.部门ID 第 44 页 共 140 页 C.部门负责人姓名 D.一个无法使用的对象 277. 批量导入Excel数据时,若遇到下拉框字段,Excel中应准备什么格式的数 据?(A) A.准备下拉框选项的显示文本 B.准备下拉框选项的编码 C.准备选项的序号 D.无法导入下拉框数据 278. 表单状态字段在流程表单中有什么作用?(B) A.由用户手动填写,描述表单情况 B.系统自动维护,表示流程当前所处的节点(如待部门审批、已完成) C.用于计算表单的提交时长 D.只是一个装饰字段,无实际作用 279. 在数据工厂中,对数据进行去重操作,应使用哪个节点?(A) A.分组汇总 B.字段设置 C.追加合并 D.横向连接 280. 在数据表格中,创建数据透视表应在哪个选项卡下操作?(B) A.开始 B.插入 C.页面布局 D.公式 281. 数据透视表的"值"字段默认的汇总方式是?(B) A.计数 B.求和 C.平均值 D.最大值 282. 想要快速,直观地对数据透视表进行筛选,最好使用什么工具?(C) A.自动筛选 B.条件格式 C.切片器 D.查找和替换 第 45 页 共 140 页 283. 当数据透视表的数据源发生变化后,应如何更新数据透视表?(C) A.重新输入数据 B.双击数据透视表刷新 C.使用"刷新"按钮 D.数据透视表会自动更新 284. 在数据透视表中,要将日期字段按"年"和"月"进行分组,应使用哪个功能? (C) A.排序 B.筛选 C.组合 D.计算字段 285. 想要更改数据透视表中某个值字段的汇总方式(如从"求和"改为"平均值"), 应如何操作?(A) A.在"值字段设置"中修改 B.直接修改数据源 C.重新创建数据透视表 D.无法更改 286. 在数据表格中,用于求和的函数是?(B) A.AVERAGE B.SUM C.COUNT D.MAX 287. 在公式中,要使行号或列标在复制时不发生改变,需要在前面添加什么符号? (C) A.@ B.# C.$ D.& 288. 函数"=IF(A1>60,及格,不及格)"的含义是?(A) A.如果A1大于60,显示"及格",否则显示"不及格" B.如果A1小于60,显示"及格",否则显示"不及格" C.计算A1是否等于60 D.将A1的值设置为60 第 46 页 共 140 页 289. 用于查找某值的函数是?(C) A.SUMIF B.COUNTIF C.VLOOKUP D.AVERAGEIF 290. 函数"=COUNTIF(A1:A10,>20)"的功能是?(B) A.计算A1到A10区域中数值的总和 B.计算A1到A10区域中大于20的数值的个数 C.计算A1到A10区域中数值的平均值 D.判断A1到A10区域中的数值是否大于20 291. 当公式中出现"#DIV/0!"错误时,通常是因为?(C) A.使用了无效的单元格引用 B.数字太大,单元格无法显示 C.公式中出现了除以零的操作 D.函数名称拼写错误 292. 函数"=SUM(B2:E2)*F2"表示?(A) A.先计算B2到E2的和,再乘以F2 B.计算B2乘以F2,再加上E2 C.计算B2到E2的平均值,再乘以F2 D.这是一个错误的公式 293. 在数据表格中,函数"=RANK(A2,A2:A18,0)"的功能是?(B) A.返回A2在区域A2:A18中的升序排名 B.返回A2在区域A2:A18中的降序排名 C.返回A2在区域A2:A18中的最大值 D.返回A2在区域A2:A18中的位置 294. 在数据表格中,要快速删除数据区域内的重复值,应在哪个选项卡下操作? (C) A.开始 B.插入 C.数据 D.视图 295. "数据验证"(或"数据有效性")功能的主要作用是?(B) A.检查数据中是否存在错误 B.限制单元格中可以输入的内容类型或范围 第 47 页 共 140 页 C.自动更正输入错误 D.加密单元格数据 296. 要将一列由"姓,名"组成的数据拆分成"姓"和"名"两列,最好使用什么功能? (C) A.自动填充 B.查找和替换 C.分列 D.合并计算 297. 函数"=TRIM(A1)"的作用是?(B) A.删除A1单元格中的所有空格 B.删除A1单元格中文本首尾的空格 C.将A1单元格中的文本转换为大写 D.计算A1单元格中文本的长度 298. 函数"=LEFT(A1,3)"的功能是?(C) A.提取A1单元格中从第3个字符开始的所有字符 B.提取A1单元格中的最后3个字符 C.提取A1单元格中的前3个字符 D.将A1单元格中的字符替换为3个字符 299. "分类汇总"功能在进行操作前,首先需要?(B) A.筛选数据 B.对分类字段进行排序 C.删除空行 D.设置数据验证 300. 要快速统一修改一列数据中的某个特定词语(如将"北京"改为"北京市"), 最好使用什么功能?(B) A.定位条件 B.查找和替换 C.拼写检查 D.自动更正 301. 要快速填充一列有规律的数据(如等差数列),最便捷的方法是使用?(B) A.复制粘贴 B.填充柄 C.序列对话框 D.手动输入 第 48 页 共 140 页 302. 以下哪种图表类型最适合显示数据随时间的变化趋势?(B) A.饼图 B.折线图 C.柱形图 D.雷达图 303. 在图表中,用于表示不同数据系列的彩色方块称为?(A) A.图例 B.数据标签 C.坐标轴 D.网格线 304. 当图表的数据源发生变化时,图表会?(A) A.自动更新 B.需要手动更新 C.不会更新 D.需要重新创建 305. 《中国华电集团有限公司数智化管理办法》的制定,主要是为了贯彻党中央, 国务院关于哪些方面的战略部署?(A) A.网络强国,数字中国建设,人工智能和数字经济发展 B.节能减排,绿色发展和能源安全 C.国企改革,提质增效和科技创新 D.安全生产,风险防控和合规管理 306. 根据《中国华电集团有限公司数智化管理办法》,下列哪项内容不属于本办 法所指数智化的管理范畴?(B) A.数智化软硬件基础设施的建设,管理和运维 B.电力生产控制区中的电力监控系统 C.数据治理和数据资源利用 D.人工智能应用场景研究与运用 307. 根据《中国华电集团有限公司数智化管理办法》,集团公司数智化管理的 方针是?(A) A.统一领导,统一规划,统一标准,分级管理,数据驱动 B.总部抓总,区域做实,基层强基 C.安全,高效,实用 D.同步规划,同步建设,同步使用 第 49 页 共 140 页 308. 根据《中国华电集团有限公司数智化管理办法》,集团公司数智化工作的 领导机构是?(B) A.集团公司科技与数智化部 B.集团公司网络安全与数智化工作领导小组 C.集团公司数智化专题会 D.集团公司总部各部门 309. 根据《中国华电集团有限公司数智化管理办法》,集团公司数智化工作的 归口管理部门是?(A) A.集团公司科技与数智化部 B.集团公司网络安全与数智化工作领导小组 C.数智中心 D.集团公司总部各部门 310. 根据《中国华电集团有限公司数智化管理办法》,数智中心的主要职责 是?(B) A.制定数智化规划,制度 B.为集团公司数智化建设、运维、保障、服务提供支撑 C.负责网络安全与AK相关管理工作 D.指导评价和考核各单位数智化工作 311. 根据《中国华电集团有限公司数智化管理办法》,集团公司数智化规划原 则上应与什么同步编制或修订?(B) A.国家五年规划 B.集团战略规划 C.年度投资计划 D.业务部门工作计划 312. 根据《中国华电集团有限公司数智化管理办法》,数智化项目原则上按照哪 四个阶段进行管理?(B) A.立项,设计,施工,验收 B.前期立项,投资决策,项目实施,后评价 C.需求分析,方案设计,开发测试,上线运维 D.规划,建设,运营,优化 313. 《中国华电集团有限公司数智化管理办法》旨在提升哪几方面的能力?(D) A.仅提升决策执行能力 B.仅提升业务协同能力 C.仅提升安全保障能力 第 50 页 共 140 页 D.提升决策执行、分级管控、业务协同、基础支撑和安全保障 314. 《中国华电集团有限公司数智化管理办法》适用于以下哪些单位?(C) A.仅集团总部 B.集团总部及境内各单位 C.集团总部及系统各单位 D.仅基层电厂 315. 《中国华电集团有限公司数智化管理办法》的制定,是为了加快推进什 么?(B) A.财务共享中心建设 B.数智化转型 C.传统信息化补课 D.行政管理流程优化 316. 根据《中国华电集团有限公司数智化管理办法》,数智化建设应遵循什么原 则?(A) A.安全,高效,实用 B.先进,超前,引领 C.经济,快速,灵活 D.统一,集中,集权 317. 根据《中国华电集团有限公司数智化管理办法》,集团公司网络安全与数智 化工作领导小组的组长由谁担任?(B) A.数智化分管领导 B.集团公司主要领导 C.科技与数智化部负责人 D.由领导小组选举产生 318. 根据《中国华电集团有限公司数智化管理办法》,集团公司网络安全与数智 化工作领导小组的主要职责不包括?(C) A.贯彻落实国家数智化转型及网信工作的政策和法规 B.审议集团公司数智化规划,重大事项等 C.直接负责统建项目的具体建设实施 D.协调解决数智化工作中的重大问题 319. 根据《中国华电集团有限公司数智化管理办法》,数智中心在集团公司数智 化工作中的定位是?(C) A.决策机构 B.进行数智化项目归口管理 第 51 页 共 140 页 C.为集团公司数智化建设、运维、保障、服务提供支撑 D.业务主管部门 320. 根据《中国华电集团有限公司数智化管理办法》,集团公司各直属单位在数 智化工作中的角色是?(B) A.仅负责配合统建项目 B.本单位数智化工作的责任主体 C.仅负责技术标准制定 D.仅负责对基层企业的考核 321. 根据《中国华电集团有限公司数智化管理办法》,数智化年度投资计划的原 则是?(B) A.可以随意突破集团公司下达的计划 B.年度费用应专款专用,原则上不得突破集团公司下达的计划 C.可根据需要随时在不同项目间任意调剂 D.仅作为参考,无需严格执行 322. 根据《中国华电集团有限公司数智化管理办法》,数智化项目管理应符合集 团公司哪些相关制度要求?(B) A.仅符合投资管理制度 B.符合投资管理、采购管理、合同管理等相关制度 C.仅符合采购管理制度 D.可以制定完全独立的项目管理规则 323. 根据《中国华电集团有限公司数智化管理办法》,数智化建设选用的产品和 服务应遵循什么要求?(B) A.仅需价格最低 B.符合国家、行业有关规定和要求,遵循集团公司统一确定的网络与技术架构 C.仅需技术最先进 D.可由各单位随意选择,无需统一 324. 根据《中国华电集团有限公司数智化管理办法》,直属单位在数智化基础设 施建设和管理工作中,应避免什么?(B) A.开展网络安全管理工作 B.开展与集团公司统建系统重复的建设工作 C.指导所属单位开展工作 D.进行技术选型评估 第 52 页 共 140 页 325. 根据《中国华电集团有限公司数智化管理办法》,各单位开展数据治理,应 实现什么管理?(B) A.数据集中统一管理 B.数据分类分级管理 C.数据完全公开管理 D.数据自由流通管理 326. 根据《中国华电集团有限公司数智化管理办法》,各单位在个人信息保护活 动中,应遵循什么原则?(A) A.谁收集信息,谁负责保护 B.谁使用信息,谁负责保护 C.仅由科技与数智化部负责保护 D.无需特别保护 327. 根据《中国华电集团有限公司数智化管理办法》,各单位开展数智化建设应 坚持网络安全的什么原则?(B) A.先建设后安全 B.同步规划,同步建设,同步使用 C.安全可以事后补 D.以业务发展为先,安全为辅 328. 根据《中国华电集团有限公司数智化管理办法》,各单位应当在国家重要活 动,会议期间制定什么以确保数智化系统安全?(C) A.仅制定网络安全保障专项工作方案 B.仅制定应急预案 C.制定网络安全保障专项工作方案和应急预案 D.无需特别制定方案,加强值班即可 329. 根据《中国华电集团有限公司数智化管理办法》,数智化标准化管理主要包 括哪些标准?(C) A.仅管理标准 B.仅技术标准 C.管理标准、技术标准、数据标准、网络安全标准等 D.仅数据标准 330. 根据《中国华电集团有限公司数智化管理办法》,各单位对硬件资产的管理 应涵盖哪个环节?(B) A.仅采购环节 B.采购、入库、存储、出库、定位、更新、运维、报废等全生命周期 第 53 页 共 140 页 C.仅运维环节 D.仅报废环节 331. 根据《中国华电集团有限公司数智化管理办法》,软件正版化工作的原则 是?(B) A.各单位自行决定是否推动 B.按照国家和集团公司的统一部署,积极稳妥地推动 C.仅购买最便宜的软件 D.可以使用未经授权的软件以节省成本 332. 根据《中国华电集团有限公司数智化管理办法》,数智化运维管理应涵盖哪 些方面?(C) A.仅应用系统 B.仅网络安全 C.基础设施、中间件、应用系统、数据、技术和网络安全等方面 D.仅数据 333. 根据《中国华电集团有限公司数智化管理办法》,系统上线前必须明确什 么?(C) A.仅明确开发厂商 B.仅明确业务需求 C.明确运维单位 D.仅明确项目预算 334. 《中国华电集团有限公司数智化项目管理办法》制定的主要目的是?(A) A.加强数智化项目管理,提高项目建设质量,控制项目实施风险 B.规范数据安全管理 C.制定技术标准 D.管理网络安全人才 335. 根据《中国华电集团有限公司数智化项目管理办法》,数智化项目以什么 为主要手段?(B) A.传统的土建,安装工程 B.以计算机、通信技术、人工智能及网络和网络安全等数智技术 C.单纯的硬件设备采购 D.行政管理流程优化 336. 根据《中国华电集团有限公司数智化项目管理办法》,由集团公司牵头管 理,为集团总部或多区域提供服务的项目称为?(B) A.总部项目 第 54 页 共 140 页 B.统建项目 C.自建项目 D.重点项目 337. 根据《中国华电集团有限公司数智化项目管理办法》,总投资达到或超过 多少万元的项目被定义为重点项目?(B) A.500 万元 B.1000 万元 C.2000 万元 D.5000 万元 338. 根据《中国华电集团有限公司数智化项目管理办法》,集团公司数智化项 目的归口管理部门是?(A) A.集团公司科技与数智化部 B.集团公司数智化专题会 C.数智化中心 D.集团公司总部各部门 339. 根据《中国华电集团有限公司数智化项目管理办法》,非重点项目的方案 审查由谁组织?(B) A.集团公司技经中心必须组织 B.项目建设单位自行组织 C.数智化专题会组织 D.必须委托外部机构 340. 根据《中国华电集团有限公司数智化项目管理办法》,项目上线评审合格 后,进入什么阶段?(B) A.项目验收阶段 B.系统试运行阶段 C.正式运行阶段 D.后评价阶段 341. 根据《中国华电集团有限公司数智化项目管理办法》,系统试运行时间原 则上不少于多久?(C) A.1 个月 B.2 个月 C.3 个月 D.6 个月 第 55 页 共 140 页 342. 根据《中国华电集团有限公司数智化项目管理办法》,重点项目的验收评 审由谁组织?(C) A.项目建设单位 B.直属单位 C.集团公司 D.项目实施厂商 343. 根据《中国华电集团有限公司数智化项目管理办法》,项目中(终)止的原 则是?(B) A.谁立项、谁中(终)止 B.谁决策、谁中(终)止 C.仅集团公司有权决定中(终)止 D.项目实施厂商可提出中(终)止 344. 根据《中国华电集团有限公司数智化项目管理办法》,原则上重点项目通 过验收并运行满多久后,开展项目后评价工作?(C) A.3 个月 B.6 个月 C.1 年 D.2 年 345. 根据《中国华电集团有限公司数智化项目管理办法》,原则上,每年几月集 团公司组织开展次年项目投资计划申报工作?(C) A.6 月 B.8 月 C.9 月 D.12 月 346. 根据《中国华电集团有限公司数智化项目管理办法》,原则上项目实施跨 度不超过几年?(C) A.1 年 B.2 年 C.3 年 D.5 年 347. 根据《中国华电集团有限公司数智化项目管理办法》,集团公司对项目投 资计划执行情况进行动态管理,直属单位每月几日前报送上月执行情况?(B) A.1 日前 B.2 日前 第 56 页 共 140 页 C.5 日前 D.10 日前 348. 根据《中国华电集团有限公司数智化项目管理办法》,项目交付件管理的 目的不包括?(D) A.降低运维成本 B.提高项目可追溯性 C.方便二次开发工作 D.作为项目决算的唯一依据 349. 根据《中国华电集团有限公司数智化项目管理办法》,集团公司每年将各 直属单位项目管理情况纳入什么考核?(B) A.安全生产考核 B.数智化绩效考核 C.党建工作考核 D.财务指标考核 350. 根据《中国华电集团有限公司数智化项目管理办法》,有关单位及人员违 反国家法律法规和集团公司规章制度的规定,造成企业损失或其他不良后果的按 照什么规定处理?(B) A.《中国华电集团有限公司数智化项目管理办法》 B.《中国华电集团有限公司违规经营投资责任追究实施办法》 C.仅进行口头批评 D.由本单位自行决定处理方式 351. 根据《中国华电集团有限公司数智化项目管理办法》数智化项目管理流程 图,,项目决策/备案通过后,统建项目投资计划由谁下达?(C) A.直属单位 B.基层企业 C.集团公司科智部 D.数智化专题会 352. 根据《中国华电集团有限公司数智化项目管理办法》,项目前期立项应研 究初步投资条件,判断投资价值,论证项目的什么?(C) A.仅必要性 B.仅可行性 C.必要性和可行性 D.仅经济性 第 57 页 共 140 页 353. 根据《中国华电集团有限公司数智化项目管理办法》,项目履行什么程序 后视同完成前期立项?(B) A.投资决策程序 B.年度投资计划决策程序 C.采购程序 D.上线评审程序 354. 根据《中国华电集团有限公司数智化项目管理办法》,直属单位完成本级 投资决策后,应通过什么系统提交《数智化项目投资决策申请(备案)表》?(C) A.财务系统 B.采购系统 C.数智化项目管理系统 D.邮件系统 355. 根据《中国华电集团有限公司数智化项目管理办法》,项目上线评审重点 检查的内容不包括?(D) A.项目建设目标的完成情况 B.项目质量 C.系统测试结果的合理性 D.项目消缺情况 356. 根据《中国华电集团有限公司数智化项目管理办法》,项目中(终)止后, 应做好哪方面工作?(C) A.仅做好数据保管 B.仅做好设备处置 C.做好相关数据、设备及资料的保管和处置工作 D.无需特别处理 357. 《中国华电集团有限公司数据管理办法(试行)》制定的首要目的是?(D) A.进一步规范数据管理工作 B.保障数据安全 C.提升数据共享开放水平 D.以上所有目的 358. 根据《中国华电集团有限公司数据管理办法(试行)》,数据管理遵循的 原则不包括?(C) A.统筹管理, B.安全可控 C.谁主管谁负责 第 58 页 共 140 页 D.分类分级 359. 根据《中国华电集团有限公司数据管理办法(试行)》,数据管理规划是 对集团公司数据管理何种性质问题的策略谋划?(B) A.临时性、突发性、整体性 B.整体性、长期性、基本性 C.局部性、短期性、基本型 D.技术性、操作性、突发性 360. 根据《中国华电集团有限公司数据管理办法(试行)》,需要跨系统、跨 部门共享的核心业务实体数据被称为?(C) A.元数据 B.参考数据 C.主数据 D.指标数据 361. 根据《中国华电集团有限公司数据管理办法(试行)》,数据质量规则管 理通常从多个维度进行,以下哪个不是常见的维度?(C) A.完整性、一致性 B.有效性、唯一性 C.经济性、美观性 D.准确性、及时性 362. 根据《中国华电集团有限公司数据管理办法(试行)》,数据生存周期管 理的主要过程不包括?(D) A.数据需求 B.数据设计与开发交付 C.数据运维 D.数据完全删除 363. 根据《中国华电集团有限公司数据管理办法(试行)》,数据采集应遵循 什么原则?(B) A.合法合规,按需采集 B.合法合规,应接尽接 C.广泛采集,多多益善 D.谁需要谁采集 364. 根据《中国华电集团有限公司数据管理办法(试行)》,数据存储应遵循 什么要求?(B) A.集中存储于一个数据库 第 59 页 共 140 页 B.数据分类分级管理要求 C.存储成本最低的要求 D.存储于性能最好的设备 365. 根据《中国华电集团有限公司数据管理办法(试行)》,数据共享管理应 遵循什么原则?(B) A.不共享为常态,共享为例外 B.共享为常态,不共享为例外 C.完全自由共享 D.禁止共享 366. 根据《中国华电集团有限公司数据管理办法(试行)》,对于涉及数据出 境的业务,应如何处理?(B) A.只要业务需要即可出境 B.应按照国家有关要求做好数据出境管理 C.禁止任何数据出境 D.由业务部门自行决定 367. 根据《中国华电集团有限公司数据管理办法(试行)》,集团公司按照什 么周期组织开展数据管理评价工作?(C) A.每季度 B.每半年 C.年度 D.每两年 368. 《中国华电集团有限公司数据管理办法(试行)》的制定依据不包括以下 哪项?(D) A.《网络安全法》《数据安全法》《个人信息保护法》 B.《密码法》《关键信息基础设施安全保护条例》 C.集团公司《中国华电集团有限公司数智化管理办法》《网络安全管理办法》 D.《中华人民共和国电力法》 369. 《中国华电集团有限公司数据管理办法(试行)》所称数据管理,是指对哪 些工作的管理?(B) A.仅数据安全和数据质量 B.数据管理规划、数据架构、数据标准、数据质量、数据生存周期、数据资产运 营、数据安全等工作的管理 C.仅数据采集和存储 D.仅数据共享和开放 第 60 页 共 140 页 370. 《中国华电集团有限公司数据管理办法(试行)》适用于哪些单位?(B) A.仅集团公司总部 B.集团公司总部和境内系统各单位 C.集团公司总部和所有单位(含境外) D.仅直属单位 371. 根据《中国华电集团有限公司数据管理办法(试行)》,集团公司数智化 工作领导小组在数据管理方面的主要职责不包括?(C) A.贯彻落实国家关于数据管理工作的政策和法律法规 B.审核集团公司数据管理规划 C.直接负责数据标准的制定 D.统筹推进集团公司数据管理工作 372. 根据《中国华电集团有限公司数据管理办法(试行)》,集团公司总部各 部门在数据管理中的主要职责不包括?(C) A.参与集团公司数据管理工作 B.负责提出本部门业务领域的数据应用需求 C.统筹集团公司对内共享、对外开放的数据需求 D.审核涉及本部门业务领域的数据共享开放需求 373. 根据《中国华电集团有限公司数据管理办法(试行)》,直属单位和基层 企业在数据生存周期管理中的职责是?(B) A.仅负责数据采集 B.开展本单位内数据采集汇聚、数据治理、数据资产运营、数据质量管理、数据 应用、数据安全等全生存周期管理工作 C.仅负责数据应用 D.仅负责配合集团工作 374. 根据《中国华电集团有限公司数据管理办法(试行)》,数据管理规划应 结合什么进行评估和滚动修编?(A) A.集团公司业务发展实际 B.技术更新速度 C.领导要求 D.预算情况 375. 根据《中国华电集团有限公司数据管理办法(试行)》,数据架构管理内 容不包含以下哪项?(D) A.数据模型 B.数据分布 第 61 页 共 140 页 C.数据集成与共享 D.数据采购 376. 根据《中国华电集团有限公司数据管理办法(试行)》,描述数据或数据 元素的数据,用于提供集团公司数据资产业务属性、技术属性、管理属性以及数 据之间关系等信息的结构数据被称为?(B) A.主数据 B.元数据 C.参考数据 D.指标数据 377. 根据《中国华电集团有限公司数据管理办法(试行)》,数据标准涵盖的 类型不包括?(C) A.业务术语标准 B.主数据标准 C.软件开发标准 D.指标数据标准 378. 根据《中国华电集团有限公司数据管理办法(试行)》,对于在运的存量 数智化系统,数据标准执行的要求是?(B) A.无需改造 B.应开展数据标准合规检查,按需改造相关系统功能 C.必须立即停运改造 D.仅新录入数据需符合标准 379. 根据《中国华电集团有限公司数据管理办法(试行)》,数据质量管理应 建立健全覆盖什么的数据质量管理体系?(D) A.数据采集环节 B.数据存储环节 C.数据应用环节 D.数据全生存周期 380. 根据《中国华电集团有限公司数据管理办法(试行)》,数据需求阶段, 原则上跨业务领域的数据共享开放等需求应基于什么实现?(B) A.各业务系统分别实现 B.数据平台实现 C.人工传递实现 D.无需统一平台 第 62 页 共 140 页 381. 根据《中国华电集团有限公司数据管理办法(试行)》,数据采集应按照 什么要求,实现一次采集、共享使用?(B) A.一数多源、多用 B.一数一源、一源多用 C.多源采集、择优使用 D.按需采集、独立使用 382. 根据《中国华电集团有限公司数据管理办法(试行)》,原则上,数据的新 增、修改、删除等变更操作应如何实现?(B) A.在数据平台上直接操作 B.需要通过对应的源业务系统实现 C.由数据库管理员直接操作数据库 D.由使用部门随意修改 383. 根据《中国华电集团有限公司数据管理办法(试行)》,数据归档退役策 略应根据什么制定?(B) A.存储空间大小 B.留存周期 C.数据重要性 D.领导要求 384. 根据《中国华电集团有限公司数据管理办法(试行)》,数据开放管理对 外提供数据时,对重要数据的要求是?(C) A.可以直接提供 B.禁止提供 C.采取防护措施下对外提供 D.仅提供脱敏后的摘要 385. 根据《中国华电集团有限公司数据管理办法(试行)》,数据资产价值管 理的方式不包括?(D) A.数据资产价值评估 B.数据资产入表 C.流通交易 D.限制数据应用以保值 386. 根据《中国华电集团有限公司数据管理办法(试行)》,数据安全管理的 具体内容不包括?(D) A.数据安全策略 B.数据安全管理执行 第 63 页 共 140 页 C.数据安全审计 D.数据价值评估 387. 根据《中国华电集团有限公司数据管理办法(试行)》,应建立覆盖什么 的数据安全防护技术体系?(C) A.数据采集环节 B.数据存储环节 C.数据全生存周期 D.数据传输环节 388. 根据《中国华电集团有限公司数据管理办法(试行)》,数据安全防护技 术手段的选择依据是?(C) A.技术先进性 B.供应商推荐 C.数据安全分类分级结果 D.统一使用一种技术 389. 根据《中国华电集团有限公司数据管理办法(试行)》,在数据安全管理 中应制定什么并按要求开展应急演练?(B) A.数据质量应急预案 B.数据安全应急预案 C.系统故障应急预案 D.网络安全应急预案 390. 根据《中国华电集团有限公司数据管理办法(试行)》,数据管理评价结 果纳入什么体系?(B) A.安全生产考核体系 B.集团公司数智化绩效考核体系 C.党建工作考核体系 D.财务指标考核体系 391. 根据《中国华电集团有限公司网络安全管理办法》,集团公司网络安全工 作应遵循的原则是什么?(A) A.统一领导、统一规划、统一架构、统一管控、统筹建设、分级负责 B.同步规划、同步建设、同步使用 C.谁主管谁负责;谁运行谁负责;谁使用谁负责;管业务必须管安全 D.集中管理、分级审批、统一运维、全程监控 第 64 页 共 140 页 392. 根据《中国华电集团有限公司网络安全管理办法》,下列哪个部门负责管 理信息区中包含关键信息基础设施在内的管理信息系统网络安全管理工作?(A) A.集团公司科技与数智化部 B.集团公司生产技术部 C.集团公司安全环保部 D.集团公司工程建设部 393. 根据《中国华电集团有限公司网络安全管理办法》,集团公司网络安全工 作坚持的“三同步”要求是指什么?(A) A.同步规划、同步建设、同步使用 B.同步设计、同步实施、同步验收 C.同步研发、同步测试、同步上线 D.同步规划、同步评估、同步改进 394. 根据《中国华电集团有限公司网络安全管理办法》,网络安全工作需坚持 的要求不包括以下哪项?(B) A.谁主管谁负责 B.谁投资谁负责 C.谁运行谁负责 D.管业务必须管安全 395. 根据《中国华电集团有限公司网络安全管理办法》,集团公司网络安全工 作的目标是什么?(A) A.动态防御、主动防御、纵深防御、精准防护、整体防控、联防联控 B.统一领导、统一规划、统一架构、统一管控、统筹建设、分级负责 C.同步规划、同步建设、同步使用 D.谁主管谁负责;谁运行谁负责;谁使用谁负责;管业务必须管安全 396. 根据《中国华电集团有限公司网络安全管理办法》,下列哪个部门负责发 电企业生产控制区中包含关键信息基础设施在内的电力监控系统网络安全管理 工作?(B) A.集团公司科技与数智化部 B.集团公司生产技术部 C.集团公司安全环保部 D.集团公司工程建设部 397. 根据《中国华电集团有限公司网络安全管理办法》,各单位网络安全工作 的第一责任人是谁?(B) A.主管网络安全的领导班子成员 第 65 页 共 140 页 B.领导班子主要负责人 C.网络安全与信息化领导小组组长 D.科技与数智化部负责人 398. 根据《中国华电集团有限公司网络安全管理办法》,各级单位网络安全与 信息化领导小组的主要职责是什么?(A) A.负责本单位网络安全工作(含生产控制区和管理信息区)的总体协调领导 B.负责管理信息大区中包含关键信息基础设施在内的管理信息系统网络安全管 理工作 C.负责生产控制大区中包含关键信息基础设施在内的电力监控系统网络安全管 理工作 D.负责本单位网络安全事件的调查与处理,督促整改措施的落实 399. 根据《中国华电集团有限公司网络安全管理办法》,各直属单位在网络安 全管理中的主要职责是什么?(C) A.仅负责本单位内部的网络安全防护,不涉及对下属单位的管理 B.统筹管理全集团公司的网络安全工作,制定总体安全策略和标准规范 C.负责所属单位的网络安全管理工作,指导和组织所属单位开展各项网络安全工 作,并监督、检查和评价其工作情况 D.主要承担网络安全事件的应急处置和技术支撑工作 400. 根据《中国华电集团有限公司网络安全管理办法》,各单位在向外国司法 或执法机构提供境内存储数据时,必须满足的前提条件是什么?(A) A.获得国家主管机关的批准 B.与外国机构签订安全保密协议 C.完成数据安全风险评估 D.经过集团公司科技与数智化部审核 401. 根据《中国华电集团有限公司网络安全管理办法》,各单位在明确各部门 和岗位网络安全职责时,需要明确的审批相关要素不包括以下哪项?(D) A.授权审批事项 B.审批部门 C.批准人 D.审批流程时长 402. 根据《中国华电集团有限公司网络安全管理办法》,各单位需要加强逐级 审批的事项不包括以下哪一项?(C) A.系统变更 B.重要操作 第 66 页 共 140 页 C.人员录用 D.物理访问 403. 根据《中国华电集团有限公司网络安全管理办法》,网络安全事件共分为 几个级别?(A) A.四个 B.三个 C.五个 D.两个 404. 根据《中国华电集团有限公司网络安全管理办法》,各单位应依据国家和 行业网络安全有关标准规范及集团公司要求,定期开展的工作包括以下哪项? (D) A.网络安全等级测评 B.密码应用安全性评估 C.关键信息基础设施网络安全检测 D.以上都是 405. 根据《中国华电集团有限公司网络安全管理办法》,各单位开展网络安全 应急演练的主要目的是什么?(C) A.防止网络安全事件发生后事态扩大 B.建立健全网络安全应急机制和专项应急预案 C.检验安全防护和应急处置能力,并根据演练情况及时优化预案 D.向上级主管部门展示网络安全管理成果 406. 根据《中国华电集团有限公司网络安全管理办法》,一般网络安全事件应 如何报送?(A) A.按照集团公司网络安全信息通报机制报送 B.按照集团公司重要情况报告制度报送集团公司总值班室 C.同步报送集团公司网络安全应急指挥部和相关业务部门 D.直接上报国家网络安全监管部门 407. 根据《中国华电集团有限公司网络安全管理办法》,各单位在建立健全供 应链安全管理策略时,下列哪项是必须明确的内容?(B) A.网络安全等级测评的具体周期 B.供应链安全管理机构、人员及其职责范围 C.网络安全事件的分级处置流程 D.工作人员保密责任的具体条款 第 67 页 共 140 页 408. 根据《中国华电集团有限公司网络安全管理办法》,各单位在建立健全供 应链安全管理制度时,应优先选择什么样的产品和服务?(A) A.自主可控、安全可靠的产品和服务 B.价格低廉、性价比高的产品和服务 C.国际知名品牌的产品和服务 D.功能全面、技术领先的产品和服务 409. 根据《中国华电集团有限公司网络安全管理办法》,当因网络产品或服务 提供方责任发生较大及以上网络安全事件时,应采取的措施是?(C) A.仅需将违规履约情况报送集团供应链管理部门,无需追究法律责任 B.仅需追究其法律责任,无需报送相关部门 C.追究其法律责任,并将违规履约情况及时报送集团供应链管理部门备案 D.等待上级部门指示后再采取相应措施 410. 根据《中国华电集团有限公司网络安全管理办法》,工作人员在履行职责 过程中对哪些对象负有严格保密义务?(C) A.网络产品和服务的供应目录、供应商评价报告 B.网络安全应急预案、重要系统专项网络安全应急预案 C.国家秘密、工作秘密、商业秘密、重要数据、个人信息和隐私 D.网络安全等级测评结果、密码应用安全性评估报告 411. 根据《中国华电集团有限公司网络安全管理办法》,各单位在网络系统废 止退役前,以下哪项不是必须满足的处置要求?(C) A.历史数据妥善处置 B.重要数据备份 C.系统漏洞修复完善 D.相关资源注销关闭 412. 根据《中国华电集团有限公司网络安全管理办法》,各单位存储处理重要 数据的网络系统应落实几级及以上网络安全等级保护要求?(C) A.一级 B.二级 C.三级 D.四级 413. 根据《中国华电集团有限公司网络安全管理办法》,供应链包含哪些环节? (D) A.网络产品(如计算机硬件、软件、网络设备等)的原材料采购、零部件制造、 产品组装 第 68 页 共 140 页 B.产品的存储、运输、销售 C.产品交付后的安装、维护、升级、技术支持 D.以上都是 414. 根据《中国华电集团有限公司网络安全管理办法》,关键信息基础设施运 行单位在项目投入运行前应完成的关键工作是什么?(A) A.组织开展网络安全验收工作 B.重新认定关键信息基础设施性质 C.制定数据分类分级标准 D.向集团公司提交运行申请 415. 根据《中国华电集团有限公司网络安全管理办法》,关键信息基础设施运 行单位应强化哪些方面的安全管理?(B) A.网络攻击防范与违法犯罪活动处置 B.供应链安全管理与数据安全管理 C.数据分类分级标准制定与业务连续运行保障 D.网络安全验收与重新认定流程管理 416. 根据文章内容,关键信息基础设施运行单位应提升哪些安全能力?(D) A.网络安全验收、系统运行监测、业务连续性保障 B.数据分类分级、数据安全管理、个人信息保护 C.供应链安全管理、网络攻击防范、违法犯罪打击 D.安全技术防护、监测预警、主动防御、事件处置 417. 根据《中国华电集团有限公司网络安全管理办法》,集团公司中负责制定 数据分类分级标准的部门是哪个?(A) A.科技与数智化部 B.安全管理部门 C.各业务单位 D.网络安全防护部门 418. 根据《中国华电集团有限公司网络安全管理办法》,各单位在数据管理中 的角色定位是什么?(C) A.各单位仅负责数据的安全存储工作 B.各单位负责制定数据分类分级标准 C.各单位为本单位的数据处理者 D.各单位需重新认定关键信息基础设施 第 69 页 共 140 页 419. 根据《生产运营管理数据规范第1部分:通用要求》,《生产运营管理数 据标准化规范》的主要作用是什么?(A) A.指导华电集团区域公司数据标准化工作的系列标准 B.直接管理华电集团的生产运营数据 C.仅规范风电和光伏领域的数据管理 D.替代企业现有的数据管理制度 420. 根据《生产运营管理数据规范第1部分:通用要求》,数据资源应通过何 种方式实现集约、高效、有序、安全的管理和利用?(A) A.标准化工作 B.增加技术投入 C.扩大管理团队 D.优化业务流程 421. 根据《生产运营管理数据规范第1部分:通用要求》,生产运营管理数据 标准化建设应遵循的基本原则不包括以下哪项?(D) A.数据安全原则 B.数据质量原则 C.数据收集原则 D.数据创新原则 422. 根据《生产运营管理数据规范第1部分:通用要求》,生产运营管理数据 标准化建设中的“数据采集原则”具体要求是什么?(D) A.根据数据重要性选择性采集和接入数据 B.发电厂侧和区域公司均遵循“应采尽采”原则 C.发电厂侧遵循“全量接入”,区域公司遵循“应采尽采” D.发电厂侧遵循“应采尽采”,区域公司遵循“全量接入” 423. 根据《生产运营管理数据规范第1部分:通用要求》,下列哪项不属于数 据质量原则的范畴?(C) A.数据可追溯性 B.数据充足性 C.等级性原则 D.数据一致性 424. 根据《生产运营管理数据规范第1部分:通用要求》,“标识”的定义是 指什么?(D) A.对客观事物的抽象,能表示具体事物和抽象规则 B.按一定规则排列的字符、数字组合对物理对象进行标识的符号 第 70 页 共 140 页 C.现实世界中客观存在的并可以相互区分的对象或事物 D.赋予物理对象唯一记号,以区别于其他物理对象 425. 根据《生产运营管理数据规范第1部分:通用要求》,以下哪项是对“编 码”的正确定义?(A) A.按一定规则排列的字符、数字组合对物理对象进行标识的符 B.赋予物理对象唯一记号,以区别于其他物理对象 C.由同类物理对象按照一定关系组成的、具有一定功能的整体 D.现实世界中客观存在的并可以相互区分的对象或事物 426. 根据《生产运营管理数据规范第1部分:通用要求》,以下哪项是对“机 组”的正确定义?(A) A.发电厂中作为电力生产基本单元的整套装置 B.由同类物理对象按照一定关系组成的、具有一定功能的整体 C.现实世界中客观存在的并可以相互区分的对象或事物 D.对客观事物的抽象,能表示具体事物和抽象规则 427. 根据《生产运营管理数据规范第1部分:通用要求》,数据标准体系规划 和实施过程不包括以下哪个阶段?(B) A.数据标准体系调研 B.数据标准的评审与报批 C.制定数据标准体系实施路线图 D.批准和发布数据标准体系(规划)和实施路线图 428. 根据《生产运营管理数据规范第1部分:通用要求》,数据标准体系规划 和实施过程包括以下哪个阶段?(A) A.数据标准体系调研 B.数据标准评审 C.数据标准发布 D.数据标准跟踪与改进 429. 根据《生产运营管理数据规范第1部分:通用要求》,数据标准化体系规 划和实施过程的六个阶段中,在“研究和参照行业最佳实践”之后的阶段是哪个? (C) A.制定数据标准体系实施路线图 B.数据标准体系调研 C.制定数据标准体系(规划) D.业务和数据分析 第 71 页 共 140 页 430. 根据《生产运营管理数据规范第1部分:通用要求》,数据标准调研工作 应主要从哪些层面开展?(A) A.企业业务运行和管理层面、国家和行业相关数据标准化规定层面、信息和业务 系统数据现状 B.企业战略规划层面、技术研发层面、市场拓展层面 C.数据采集层面、数据存储层面、数据分析层面 D.国际标准层面、地方标准层面、企业内部标准层面 431. 根据《生产运营管理数据规范第1部分:通用要求》,业务调研的主要目 的是什么?(B) A.制定企业数据标准体系实施路线图 B.了解数据标准化在业务方面的作用和存在的问题 C.收集和学习同行业数据标准体系建设案例 D.分析信息系统数据库字典和数据标准化现状 432. 根据《生产运营管理数据规范第1部分:通用要求》,系统调研的主要目 的是什么?(A) A.厘清实际生产中数据的定义方式和对业务流程、业务协同的作用和影响 B.制定企业数据标准体系的实施路线图 C.收集和学习同行业数据标准体系建设案例 D.分析数据标准化现状和存在的问题 433. 根据《生产运营管理数据规范第1部分:通用要求》,数据标准公开征求 意见的时间要求是多少?(C) A.不少于15天 B.不少于7天 C.不少于10天 D.不少于5天 434. 根据《生产运营管理数据规范第1部分:通用要求》,在数据标准评审环 节,关于评审专家组的组成,以下哪项描述是正确的?(A) A.评审专家组不应包含编制组的成员 B.评审专家组必须全部由编制组的核心成员组成 C.评审专家组应包含至少一名编制组的负责人 D.评审专家组的组成没有特殊限制要求 435. 根据《生产运营管理数据标准化规范第2部分:数据项分类、分级、术语 和定义及其计算公式》,以下哪项属于数据安全等级中的4级数据?(C) A.对外无条件公开的一般数据 第 72 页 共 140 页 B.对内无条件公开的一般数据 C.重要数据 D.核心数据 436. 根据《生产运营管理数据标准化规范第2部分:数据项分类、分级、术语 和定义及其计算公式》中数据分类之间的关系特征,以下哪项准确描述了生产运 行与其他业务的关系?(B) A.生产运行从属于经营管理,是经营管理的具体执行环节 B.生产运行为企业核心业务活动,计划管理、生产管理、安全管理围绕其开展 C.生产运行与计划管理相互独立,各自开展业务活动 D.生产运行主要受安全管理指导,与计划管理无关 437. 根据《生产运营管理数据标准化规范第2部分:数据项分类、分级、术语 和定义及其计算公式》,以下哪项是上网电量基数外的正确定义?(B) A.指执行企业批复电价的上网电量 B.指企业参与电力市场交易而获得的上网电量,通常由调度部门按月下达计划 C.统计周期内电厂从电网获得的电量 D.统计周期内电厂变电站消耗的全部电能 438. 根据《生产运营管理数据标准化规范第3部分:数据采集技术要求》,当 采集系统在实时数据和历史数据双数据流传输时,应如何处理?(B) A.优先保证历史数据传输,确保数据完整性 B.优先保证实时数据传输,续传完成后恢复正常数据流 C.同时传输实时数据和历史数据,平均分配带宽 D.暂停历史数据传输,仅传输实时数据 439. 根据《生产运营管理数据标准化规范第3部分:数据采集技术要求》,数 据存储及转发终端的最低数据存储能力是多长时间?(B) A.3 个月 B.6 个月 C.3 年 D.5 年 440. 根据《生产运营管理数据标准化规范第4部分:数据编码规范》,全厂码 的主要作用是什么?(C) A.赋予物理对象唯一记号,以区别于其他物理对象 B.对系统进一步划分、具有实现部分系统功能的物项组合 C.用于对整个电厂的第一次细分,表示电厂机组、全厂的或若干机组的公用系统 及扩建部分 第 73 页 共 140 页 D.按一定规则排列的字符、数字组合对物理对象进行标识的符号 441. 根据《生产运营管理数据标准化规范第4部分:数据编码规范》,以下哪 项最准确地描述了“系统”的定义?(A) A.由同类物理对象按照一定关系组成的、具有一定功能的整体 B.发电厂中作为电力生产基本单元的整套装置 C.对系统进一步划分、具有实现部分系统功能的物项组合 D.用于对整个电厂的第一次细分,表示电厂机组及公用系统 442. 根据《中国华电集团有限公司数智化电厂建设指导意见》,数智化电厂建 设应遵循的基本原则不包括以下哪项?(D) A.坚持目标导向 B.坚持创新驱动 C.坚持统筹推进 D.坚持效率至上 443. 根据《中国华电集团有限公司数智化电厂建设指导意见》,数智化电厂建 设的具体目标中,利用先进技术实现的核心功能不包括以下哪项?(C) A.智能感知 B.智能诊断 C.智能维护 D.智能控制 444. 根据《中国华电集团有限公司数智化电厂建设指导意见》,数智化电厂建 设的总体目标不包括以下哪项?(D) A.安全管控存在的滞后和盲区等问题 B.提升发电企业安全生产管理水平和外部环境适应能力 C.为生产经营决策提供技术支撑 D.全面替代人工操作,实现无人值守的智能化电厂运行模式 445. 根据《中国华电集团有限公司数智化电厂建设指导意见》,华电电科院在 集团公司数智化电厂建设中的职责不包括以下哪项?(B) A.制订和完善数智化电厂建设技术清单 B.负责全厂类数智化建设的统筹工作 C.做好技术储备、技术攻关和方案编制 D.参与数智化建设项目的总结验收及评估评价 446. 根据《中国华电集团有限公司数智化电厂建设指导意见》,相关直属单位 在数智化电厂建设中的职责不包括以下哪项?(C) A.统筹、指导、监督、协调所属发电企业数智化电厂建设工作 第 74 页 共 140 页 B.参与项目实施过程的质量管控及项目后评估 C.制定集团公司数智化电厂建设指导意见和技术清单 D.督导发电企业按期高质量完成项目建设 447. 根据《中国华电集团有限公司数智化电厂建设指导意见》,基层企业作为 数智化电厂建设的责任主体,不需要承担的工作是?(D) A.根据指导意见制定数智化电厂建设规划 B.按照数智化电厂建设技术清单开展技术调研、可研编制和方案制定 C.负责项目建设全过程管理 D.制定集团公司数智化电厂建设技术清单 448. 根据《中国华电集团有限公司数智化电厂建设指导意见》,以下哪种类型 的发电机组原则上不列入燃机数智化电厂建设范围?(D) A.存量E级重型燃气发电机组 B.航改型燃气发电机组 C.新建H级重型燃气发电机组 D.内燃机发电机组 449. 根据《中国华电集团有限公司数智化电厂建设指导意见》,以下哪项符合 水电数智化电厂的建设范围要求?(B) A.总装机280MW的水电厂优先开展全厂数智化建设 B.总装机300MW的大(2)型水电厂优先开展全厂数智化建设 C.所有存量水电厂均需同步开发局部模块应用 D.新建水电厂无论装机规模大小均需开展全厂数智化建设 450. 根据《中国华电集团有限公司数智化电厂建设指导意见》,新能源数智化 电厂实施计划第三阶段(2026-2028年)的核心任务是什么?(D) A.总结形成新能源场站数智化建设技术规范 B.优化新能源智慧生产管理平台,启动18个区域智慧平台推广 C.实现新能源智慧生产管理平台建设全覆盖,深化远程集控模式 D.结合人工智能AI+、大数据、云计算等技术对新能源智慧生产管理平台升级迭 代 第 75 页 共 140 页 二、多选题 1. 以下哪些是神经网络在感知机的基础上做的改进?(ABD) A.加入隐藏层,隐藏层可以有多层,增强模型的表达能力 B.输出层的神经元也可以不止一个,可以有多个输出 C.引入了损失函数 D.对激活函数做扩展,包括Sigmoid函数、Softmax和ReLU等 2. 以下哪些是大语言模型Transformer结构中的组成部分?(ABCD) A.嵌入层 B.归一化层 C.自注意力 D.靠近输出的线性层 3. 机器学习中,特征工程的步骤通常包括哪几个?(ABC) A.特征提取,从原始数据中获取有价值的特征 B.特征选择,筛选出对模型最有用的特征 C.特征转换,对特征进行标准化、归一化等操作 D.特征删除,删除所有缺失值较多的特征 4. Attention 机制的计算过程中,为得到注意力分数,需要用哪些选项进行相 似度计算?(AD) A.query B.weight C.value D.key 5. 以下哪些场景适合使用知识检索增强(RAG)技术?(ABC) A.数据经常变动 B.要求答案准确 C.数据涉及隐私安全 D.要求改变模型输出风格 6. 以下哪些聚合函数忽略NULL值?(ABCD) A.SUM() B.COUNT(column) C.AVG() D.MAX() 7. 以下关于Pandas索引的描述,正确的是哪几项?(ABC) A.设置索引可加速查询 第 76 页 共 140 页 B.MultiIndex 支持多维数据 C.pd.Index 不可变 D.reset_index()减少内存 8. 二叉树遍历中,哪些组合可以唯一确定二叉树:(ABD) A.前序+中序 B.后序+中序 C.前序+后序 D.层序+中序 9. 下列查找算法中,平均时间复杂度为O(logn)的有:(BCD) A.二叉搜索树查找 B.平衡二叉树查找 C.红黑树查找 D.B 树查找 10. 以下关于ReLU激活函数优点的描述,正确的是哪些项?(BC) A.输出有界,训练不易发散 B.计算简单 C.有效缓解了梯度消失的问题 D.有神经元死亡的现象 11. 以下关于“降维”的描述,正确的是哪些?(AB) A.降维是将原高维空间中的数据点映射到低维度的空间中 B.降维的本质是学习一个映射函数 C.降维只会影响模型的训练速度,不会影响效果的好坏(评估指标) D.通过降维对特征数量进行压缩,不会造成信息的损失 12. John 需要完成图像分类任务,准备对训练后的模型进行评估,常用的评估 指标包含以下哪些选项?(ABC) A.准确率 B.精确率 C.召回率 D.均方误差 13. 在卷积神经网络中,池化层(PoolingLayer)的主要作用是什么?(BD) A.增加特征图的尺寸 B.减少特征图的尺寸 C.提取更多的特征 D.提高计算效率 第 77 页 共 140 页 14. 以下关于反向传播算法的描述,正确的是哪些项?(ABCD) A.误差反向传播之前需要先进行信号正向传播 B.反向传播过程中需要计算每个神经元的误差项 C.反向传播的本质是链式求导法则 D.反向传播的目的是计算梯度,更新参数 15. 大模型微调时,以下哪个选项需要注意。(ABC) A.微调数据应与预训练数据分布相似,同时体现特定任务特点 B.微调时学习率一般设置得比预训练时小 C.微调后需在新的测试集上评估模型性能 D.可以直接使用预训练模型的所有参数,无需调整 16. 影响微调效果的关键参数有?(ABC) A.学习率 B.训练轮数(Epoch) C.批次大小(BatchSize) D.模型的层数 17. AI Agent 的四要素是哪几项?(ABCD) A.规划 B.工具 C.记忆 D.行动 18. RAG 技术与传统微调技术相比,具备的优势有(ACD) A.无需修改模型参数 B.不占用用户的输入上下文长度 C.知识库可动态更新 D.回答可验证,可追溯 19. 以下哪些场景适合使用RAG(检索增强生成)?(AC) A.当需要实时从大规模文档中获取信息并生成答案时 B.当模型面对简单的数学计算题时 C.当需要回答内容具备出处来源时 D.当数据是高度结构化的表格,不涉及文本生成时 20. 在机器学习项目中,数据预处理通常包括?(ABC) A.缺失值填充 B.特征缩放 C.独热编码 第 78 页 共 140 页 D.模型部署 21. 大模型推理阶段的生成算法及优化策略,正确的有?(ABCD) A.Top-K 采样 B.Top-P 采样 C.束搜索 D.长度惩罚 22. 关于Transformer 架构的应用,说法正确的有?(BCD) A.仅用于自然语言处理任务 B.依赖自注意力机制捕捉长距离依赖 C.支持并行计算,提升训练效率 D.是BERT、GPT 等大模型的基础架构 23. 深度学习中,用于缓解模型过拟合的技术手段包括?(ABC) A.数据增强 B.权重衰减 C.早停 D.批量归一化 24. 以下哪些是RAG系统中常用的检索技术?(ABD) A.关键词匹配检索 B.向量相似度检索 C.自注意力机制计算 D.知识图谱关联检索 25. 多元svm问题是用通过哪些策略解决的?(BC) A.多元函数 B.一对一 C.一对多 D.多对一 26. 决策树模型常常用来解决分类和回归问题。常见的算法包括(ABC) A.CART B.ID3 C.C4.5 D.随机森林 27. 下列属于SVM的核函数的有哪些?(ABCD) A.高斯核函数 B.多项式核函数 第 79 页 共 140 页 C.线性核函数 D.sigmoid 核函数 28. 常见的回归算法包括(ABCD) A.线性回归 B.逻辑回归 C.多项式回归 D.逐步回归 29. 描述推荐算法效果的指标有?(ABC) A.准确率 B.覆盖率 C.召回率 D.稳定率 30. 集成学习算法主要有哪些类型(BC) A.Decisiontree B.Bagging C.boosting D.svd 31. 以下哪些算法可用于分类预测(ABC) A.SVM B.神经网络 C.逻辑回归 D.协同过滤 32. 逻辑回归与多元回归分析有哪些不同?(AC) A.逻辑回归预测某事件发生的概率 B.逻辑回归有较高的拟合效果 C.逻辑回归算法的评估 D.以上全选 33. 以下属于特征工程的有?(ABCD) A.数据清理 B.数据集成 C.数据归约 D.数据变换 第 80 页 共 140 页 34. 下面哪个/些超参数的增加可能会造成随机森林数据过拟合?(BD) A.树的数量 B.树的深度 C.学习速率 D.子树的深度 35. 以下哪些是Python的特点?(ABCD) A.简单 B.高级 C.强大而丰富的库 D.面向对象 36. 以下说法正确的有(ABCD) A.线程和进程一样共享内存资源 B.死锁是引入互斥锁的一种可能出现的副作用 C.一个程序至少拥有一个进程,一个进程至少拥有一个线程 D.列表是可迭代对象,但不是迭代器 37. 以下哪些是Python的运算符(ABC) A.算术运算符 B.赋值运算符 C.成员运算符 D.矩阵运算符 38. 自定义函数必须的结构有(ABC) A.def 关键词 B.函数名称和小括号() C.冒号: D.关键词参数 39. 自定义类必须的结构有(ABD) A.class 关键词 B.类名 C.小括号和父类名称 D.冒号: 40. 以下哪些是Python3的数字类型?(ABC) A.int(整型) B.float(浮点型) C.complex(复数) 第 81 页 共 140 页 D.布尔型 41. 以下()属于线性分类器最佳准则?(ACD) A.感知准则函数 B.贝叶斯分类 C.支持向量机 D.Fisher 准则 42. GBDT 的损失函数有哪些?(ABCD) A.均方差 B.Huber 损失函数 C.分位数损失函数 D.指数损失函数 43. 可以并行计算的集成学习算法有(AC) A.randomforest B.svd C.Bagging D.boosting 44. GBDT 的正则化方法有哪些?(ACD) A.CART 回归树进行正则化剪枝 B.核函数 C.子采样比例 D.步长 45. 下列哪些属于关联算法(BC) A.决策树 B.Apriori 算法 C.FP-growth 算法 D.SVM 46. TensorFlow 的应用场景包括?(ABCD) A.AlphaGo B.人脸识别 C.图像风格变化 D.自动驾驶 47. 循环神经网络适用于以下哪种场景。(ABCD) A.语言模型 B.机器翻译 第 82 页 共 140 页 C.语音识别 D.推荐系统 48. 什么样的数据集不适合用深度学习?(AB) A.数据集太小 B.数据集没有局部相关性。 C.数据集类别较为单一。 D.数据有局部相关性 49. 以下哪些是当前人工智能的主要技术方向(ABCD) A.计算机视觉 B.语音处理 C.自然语言处理 D.辅助决策和统计分析 50. 训练误差会降低模型的准确率,产生欠拟合,此时如何提升模型拟合度? (ABCD) A.增加数据量 B.特征工程 C.减少正则化参数 D.增加特征 51. 卷积神经网络适用于以下哪种场景。(BCD) A.知识表示 B.无人驾驶 C.语音识别 D.花类识别 52. 以下哪些是运营商人工智能的主要应用?(ABCD) A.个人助理、智慧家庭 B.智能客服 C.辅助运营 D.辅助运维 53. 以下是数据分析技巧的是?(ABD) A.象限法 B.二八法 C.多维法 D.漏斗法 第 83 页 共 140 页 54. 以下哪些属于深度学习算法的激活函数?(ABC) A.Sigmoid 函数 B.Relu 函数 C.Tanh 函数 D.Sin 函数 55. 以下关于那些结构属于LSTM?(ABC) A.输入门 B.遗忘门 C.输出门 D.记忆门 56. 常见的聚类算法有哪些?(ABCD) A.K-means B.层次聚类 C.密度聚类 D.谱聚类 57. 在深度学习模型训练的过程中,常见的优化器有哪些?(ABCD) A.SGD B.Adagrad C.Adam D.动量优化器 58. 感知器在空间中可以展现为?(ABCD) A.点 B.线 C.平面 D.超平面 59. 面向对象编程的优势有哪些(ABCD) A.提高代码复用性 B.使程序的编码更加灵活,提高了代码的可维护性 C.提高程序的可扩展性 D.提高开发效率 60. 以下属于机器学习算法的有?(ABCD) A.有监督学习 B.无监督学习 C.半监督学习 第 84 页 共 140 页 D.强化学习 61. 关于反向传播,以下说法正确的是(ABD) A.反向传播指的是误差通过网络反向传播 B.反向传播会经过激活函数 C.反向传播只能在前馈神经网络中运用 D.反向传播可以结合梯度下降算法更新网络权重 62. 关于梯度下降以下说法错误的是?(ABD) A.使用梯度下降时,学习率应该保持一致 B.全局梯度下降比随机梯度下降速度更快 C.随机梯度下降对噪声点敏感 D.Adam 不属于梯度下降算法 63. 以下哪些选项是决策树用于划分节点的依据?(AC) A.Gini 系数 B.ID3 C.信息熵 D.CART 64. 以下关于神经网络的说法正确的是?(ACD) A.单层感知器的局限在于不能解决异或问题 B.随着神经网络隐藏层数的增加,模型的分类能力逐步减弱 C.前馈神经网络同一层的神经元之间不存在联系 D.前馈神经网络可用有向无环图表示 65. 关于对抗生成神经网络以下说法正确的是?(ACD) A.对抗生成神经网络包含生成模型与判别模型 B.对抗生成网络不能用来产生新的图片 C.生成模型的输入可以是随机数 D.判别模型需要输入带标签的真实样本 66. 以下排序算法具有稳定性的有(AD) A.插入排序 B.选择排序 C.希尔排序 D.归并排序 67. 下列哪个模块用于数据处理和分析(ABCD) A.matplotlib B.numpy 第 85 页 共 140 页 C.pandas D.scipy 68. 深度学习中以下哪些步骤是由模型自动完成的?(BCD) A.分析定位任务 B.模型训练 C.特征提取 D.特征选择 69. 以下哪些模型可以用来做分类?(BCD) A.线性回归 B.SVM C.逻辑回归 D.决策树 70. 深度学习中常用的损失函数有?(CD) A.L1 损失函数 B.自下降损失函数 C.均方误差损失函数 D.交叉熵误差损失函数 71. 模型训练中避免过拟合的策略有哪些?(ABC) A.Dropout B.L2,L1 正则 C.提前停止训练 D.延迟停止训练 72. 最优化问题根据约束条件可分为以下哪些类?(ABC) A.等式约束条件 B.不等式约束条件 C.无约束条件 D.半约束条件 73. 机器学习范式包括(ABC) A.监督学习 B.非监督学习 C.强化学习 D.概率统计 74. 缺失值处理的方法有(ABC) A.删除法 第 86 页 共 140 页 B.回归 C.均值填充 D.互信息法 75. 下列属于数据挖掘流程的是(ABCD) A.数据采集 B.数据清洗 C.数据建模 D.模型评估 76. 人工智能包括哪些要素?(ABCD) A.算法 B.算力 C.数据 D.场景 77. 人工智能现在的技术应用方向主要有?(ABD) A.计算机视觉 B.自然语言处理 C.智能机器人 D.语音识别 78. 以下选项中对随机变量数值特征描述正确的是?(ABD) A.期望反映的是随机变量取值的平均水平 B.方差反映的是随机变量和其数学期望之间的偏离程度 C.期望越大,方差越小 D.相关系数用来度量两个变量间的线性关系 79. 人工智能的三个阶段是哪三个阶段?(ACD) A.计算智能 B.行动智能 C.感知智能 D.认知智能 80. 以下关于张量说法正确的是?(ACD) A.张量是一个多维数组。 B.四阶及以上的张量,如四维及以上的向量一样没有直接的几何意义 C.一个矩阵是一个二阶张量。 D.深度学习中的很多运算与模型优化过程都是基于张量完成。 81. 深度学习在以下哪些领域当中有广泛的应用?(BCD) 第 87 页 共 140 页 A.异构化数据处理 B.自然语言处理 C.语音处理 D.结构化数据处理 82. 以下哪些是数据清理中空值的处理方式:(ABC) A.均值填充 B.中位数填充 C.直接删除 D.不用管 83. 常用的模型调优方法有哪些:(ABC) A.网格搜索 B.随机搜索 C.集成方法 D.随机抽取 84. 常用的神经网络优化方法(避免过拟合,提高模型泛化性)有哪些(ABCD) A.earlystopping B.数据集扩增 C.正则化(Regularization) D.Dropout 85. 神经网络中常见的优化器有哪些(ABCD) A.SGD B.BGD C.Momentum D.AdaGrad 86. 神经网络梯度消失、爆炸的问题,常见的解决方法有哪些(ABCD) A.Xavier 和 HE 初始化 B.梯度剪切、正则 C.非饱和激活函数 D.Batchnorm 87. 以下属于卷积神经网络中的层是(ABCD) A.卷积层 B.池化层 C.输入层 D.全连接层 第 88 页 共 140 页 88. 下面哪些超参数的增加不会造成随机森林数据过拟合?(BCD) A.树的深度 B.学习率(learningrate) C.训练线程数 D.树的数量 89. 在电力系统的数据治理工作中,评估数据质量的核心维度通常包括哪些? (ABC) A.数据的完整性,即数据是否存在缺失值或空值。 B.数据的一致性,即同一数据在不同系统中是否逻辑一致。 C.数据的时效性,即数据是否在有效时间范围内。 D.数据的娱乐性,即数据是否生动有趣以吸引分析人员。 90. 为构建一个用于识别电力设备(如绝缘子、断路器)的计算机视觉模型,在 数据集构建阶段,必要的标注工作通常包括:(ABC) A.为图片中的目标设备绘制矩形边界框(BoundingBox)。 B.为边界框内的设备标注具体的类别(如“绝缘子”、“防震锤”)。 C.标注设备的状态(如“完好”、“破损”、“锈蚀”)。 D.为图片生成一段富有文学色彩的描述性文字。 91. 在部署应用于电力生产控制或客户服务的大模型时,需遵循的国家标准或规 范主要关注哪些安全方面?(ABCD) A.模型的可解释性,确保决策过程能被人类理解。 B.数据的隐私保护,防止训练数据中的敏感信息泄露。 C.模型的鲁棒性,能够抵抗对抗性攻击或异常输入。 D.生成内容的安全性,避免产生有害、偏见或违规内容。 92. 以下哪些是当前大语言模型(LLM)在电力企业信息化中具有潜力的应用场 景?(ABC) A.作为智能客服,理解并回答用户关于电费、报装、故障报修的自然语言问题。 B.辅助编写和总结安全生产规程、技术报告、会议纪要等文档。 C.根据数据库Schema和自然语言描述,自动生成SQL查询语句,辅助数据分析。 D.完全自主地设计并开发一套全新的电力调度系统。 93. 在评估一个用于识别“窃电行为”(二分类问题)的AI模型时,以下哪些 指标是重要且常用的?(ABCD) A.精确率(Precision):预测为窃电的案例中,真正是窃电的比例。 B.召回率(Recall):所有真实的窃电案例中,被模型正确找出的比例。 C.F1-Score:精确率和召回率的调和平均数,用于综合评估。 第 89 页 共 140 页 D.准确率(Accuracy):所有预测正确的样本占总样本的比例。 94. 电力负荷预测是典型的时序数据分析问题。以下哪些场景或方法特别适用于 时间序列分析?(ABD) A.根据历史用电数据,预测未来24小时的区域总负荷。 B.分析变压器油色谱数据,预测其潜在的故障风险。 C.根据用户的缴费行为、用电模式进行客户分群。 D.使用循环神经网络(RNN)或长短期记忆网络(LSTM)构建预测模型。 95. 为构建一个用于识别输电线路巡检图片中“绝缘子破损”的视觉AI模型, 需要准备高质量的标注数据集。以下哪些措施对于保证标注数据质量是至关重要 的?(ABC) A.制定详细、无歧义的标注规范与示例。 B.对标注人员进行充分的业务与规范培训。 C.采用多人标注同一批数据,并通过一致性检验来筛选。 D.仅进行一次标注,并完全信任资深标注员的判断。 96. 集团计划制定内部的AI模型开发标准规范。以下哪些环节应被纳入标准的 模型开发流程?(ABCD) A.业务需求分析与可行性评估。 B.数据准备、清洗与特征工程。 C.模型训练、验证与超参数调优。 D.模型部署上线与持续监控。 97. 关于大模型(如ChatGPT等)在电力行业应用中的安全风险,以下哪些描述 是正确的? A.可能因训练数据包含敏感信息而导致数据泄露。(ABCD) B.其生成的文本或代码可能存在事实性错误(幻觉)或偏见。 C.可能被恶意注入“后门”,在特定触发条件下产生错误输出。 D.模型本身作为核心资产,存在被窃取或逆向工程的风险。 98. 在电力行业进行AI模型开发时,数据治理至关重要。以下哪些是数据治理 在AI项目中的核心目标?(ABD) A.确保训练数据的质量、一致性和完整性 B.建立数据血缘,追踪数据在模型训练中的使用路径 C.仅关注数据存储的硬件成本优化 D.制定数据安全与隐私保护策略,明确数据使用权限 第 90 页 共 140 页 99. 在构建一个用于预测变压器故障的机器学习模型时,数据分析阶段通常包含 下列哪些关键步骤?(ABD) A.探索性数据分析(EDA),了解数据分布与异常值 B.特征工程,从原始运行数据(如油温、负荷)中构造更有预测能力的特征 C.直接使用未经处理的原始数据开始模型训练以节省时间 D.数据可视化,帮助业务专家理解数据模式并确认分析方向 100. 为训练一个识别电力设备红外图像的视觉模型,构建高质量数据集时应注 意哪些原则?(ABD) A.标注规范必须统一且明确,例如对“绝缘子破损”的定义要清晰 B.数据应尽可能覆盖各种天气条件、拍摄角度和设备型号 C.为了快速上线,可以只用单一工况下的清晰图片进行训练 D.需要对数据集进行划分,明确训练集、验证集和测试集的用途 101. 针对电力客服场景微调一个大语言模型(LLM)时,以下哪些做法是合理的? (ABD) A.使用高质量的电力专业问答对话数据作为微调训练集 B.采用指令微调(InstructionTuning)方法,让模型更好地遵循电力客服的回 复规范 C.为了节省成本,仅用几十条通用对话数据进行微调 D.在微调后,使用包含专业术语和复杂查询的测试集评估模型效果 102. 为确保电力AI模型(如负荷预测模型)的应用安全,需要考虑哪些方面? (ABD) A.模型鲁棒性测试,防止对抗性样本攻击导致预测失灵 B.对模型的输入输出进行监控和审计,及时发现异常行为 C.模型本身安全与系统网络安全无关,可分开考虑 D.建立模型失效的应急预案和回退机制 103. 为某个具体的电力业务场景(如短期风电功率预测)选择AI模型时,应主 要考虑哪些因素?(ABC) A.业务问题的性质(是分类、回归还是时序预测) B.可用数据的规模、质量和特征维度 C.模型部署环境的计算资源限制和实时性要求 D.盲目选择当前学术论文中最热门的复杂模型 104. 在评估一个用于识别输电线路鸟巢的图像分类模型时,以下哪些指标是有 效的?(ABD) A.精确率(Precision)和召回率(Recall),并可根据业务侧重调整阈值 第 91 页 共 140 页 B.混淆矩阵,分析模型在“有鸟巢”和“无鸟巢”类别上的具体错误 C.仅关注模型在训练集上的准确率(Accuracy) D.在独立的、具有代表性的测试集上计算F1-Score等综合指标 105. 关于大模型在电力行业的应用,以下哪些说法是正确的?(ABD) A.可以作为智能知识库,快速检索电力规程、设备手册等非结构化文档 B.其强大的代码生成能力可用于辅助编写巡检机器人控制脚本 C.可以直接替代现有的专业仿真软件进行电网潮流计算 D.在应用前需针对电力领域的专业术语和知识进行适应性优化 106. 以下哪些属于大模型评测面临的挑战?(ABCD) A.基础模型能力多样化,难以全面评测 B.缺乏统一的业界评测标准 C.缺乏针对企业应用场景的评测标准 D.模型更新迭代快,业务难以快速评估新模型效果 107. 以下哪些属于大模型评测的通用基础能力范畴?(ABCD) A.记忆能力 B.推理能力 C.语言理解能力 D.指令遵从能力 108. 以下哪些属于大模型评测中“模型安全评测”的内容?(ABC) A.语料安全 B.模型服务安全 C.API 推理安全 D.模型推理性能 109. 以下哪些属于模型性能评测中常用的指标?(ABC) A.首Token 时延 B.总时延 C.吞吐率 D.模型参数量 110. 以下哪些属于影响模型推理性能的关键因素?(ABCD) A.请求并发数 B.输入长度 C.输出长度 D.问题类型 第 92 页 共 140 页 111. 以下哪些属于大模型评测中“鲁棒性评测”的主要内容?(AB) A.内容/格式扰动鲁棒性 B.抗干扰性 C.模型参数量 D.模型训练时间 112. 以下哪些属于评测集中“逆向补充”构建方式的来源?(AB) A.抓取用户事件 B.识别高效用户行为 C.专家积累FAQ D.产品资料 113. 以下哪些属于自动评测的主要方式?(AB) A.Benchmark 评测(规则算法) B.裁判模型评测(LLM-as-Judge) C.人工打分 D.模型竞技场 114. 以下哪些属于人工评测的主要方式?(AB) A.按评分标准打分 B.模型竞技场 C.Benchmark 评测 D.裁判模型评测 115. 以下哪些属于Benchmark评测的局限?(ABC) A.有限的能力项 B.忽略用户体验 C.可解释性低 D.评测成本高 116. 以下哪些属于RAG解决方案评测中常用的评测指标?(AB) A.端到端生成准确率 B.工具调用准确率 C.首Token 时延 D.模型参数量 117. 以下哪些属于Agent解决方案评测中工具调用的评测维度?(ABCD) A.任务拆解准确 B.任务决策准确 C.参数准确 第 93 页 共 140 页 D.最终调用结果准确 118. 以下哪些属于大模型评测结果分析中常见的内容?(ABC) A.自动评测结果统计 B.人工评测结果报告 C.Badcase 分析与归类 D.模型训练时间分析 119. 以下关于模型评测的说法,哪些是正确的?(ABC) A.小模型通常针对单一任务开展评测 B.大模型评测手段更加多元化 C.大模型可以类比为“人”,技能多样 D.小模型评测不需要使用数据集 120. 以下关于企业模型评测挑战的说法,哪些是正确的?(ABCD) A.缺乏针对企业应用的评测标准 B.模型更新迭代快 C.各业务场景关注的能力不同 D.企业希望快速评估新模型是否适合业务 121. 以下关于大模型评测范围的说法,哪些是正确的?(ABCD) A.通用基础能力 B.领域基础能力 C.场景应用能力 D.模型安全与可靠性 122. 以下关于评测任务设计思路的说法,哪些是正确的?(ABC) A.基础L0模型侧重通用能力 B.行业L1模型侧重行业能力 C.场景L2模型侧重应用场景 D.所有模型都使用同一套评测集 123. 以下关于自动评测与人工评测对比的说法,哪些是正确的?(ABC) A.自动评测效率高 B.人工评测更接近实际使用场景 C.人工评测成本高 D.自动评测不需要评测指标 124. 以下关于评测指标的说法,哪些是正确的?(ABCD) A.可以使用token级指标 B.可以使用语义相似度指标 第 94 页 共 140 页 C.可以使用采纳率 D.可以使用任务通过率 125. 以下关于SuperCLUE评测维度的说法,哪些是正确的?(AB) A.通用基准 B.专项基准 C.仅评测基础能力 D.不涉及长文本能力 126. 以下关于长文本评测“大海捞针”实验的说法,哪些是正确的?(ABC) A.用于测试模型长文本中的信息检索能力 B.将“针”埋入长文本中 C.测试模型是否能准确提取“针” D.仅适用于Claude模型 127. 以下关于C-Eval评测集的描述,哪些是正确的?(ABC) A.是一个中文基础模型评估套件 B.包含13948个多项选择题 C.涵盖52个不同学科 D.仅包含客观题,不包含主观题 128. 以下关于AgentBench的描述,哪些是正确的?(ABCD) A.用于评估LLM智能体的推理和决策能力 B.包含操作系统环境 C.包含数据库环境 D.包含网页浏览环境 129. 以下关于RAG(检索增强生成)的说法,哪些是正确的?(ACD) A.RAG 是一种具有信息检索能力的生成式人工智能 B.RAG 完全依赖大模型内部的静态训练数据 C.RAG 使模型根据指定的一组文档来响应用户查询 D.RAG 可帮助LLM使用特定领域或时效性的信息 130. 以下关于大模型内部知识与外部知识的说法,哪些是正确的?(AC) A.模型内部知识是参数化知识,隐式储存在神经网络权重中 B.模型内部知识是从外部知识库中实时获取的 C.外部知识是非参数化知识,显式存储在外部知识库中 D.外部知识是模型从训练数据集中学习得到的 131. 以下关于RAG与微调的说法,哪些是正确的?(AC) A.微调是在已训练好的模型基础上,使用新数据集进行进一步训练 第 95 页 共 140 页 B.微调主要用于解决模型的时效性问题 C.RAG 通过检索外部知识增强模型回答 D.微调不需要使用新的数据集 132. 以下哪些属于RAG应用中的实践特点?(ABC) A.为事实性知识提供相应的网页来源 B.有助于缓解大模型的幻觉问题 C.通过多轮RAG补充多个不同角度的知识 D.完全替代了传统搜索引擎 133. 数据分析的“四要素”通常包括?(ABCD) A.目的(Why):明确要解决的业务问题 B.数据(What):收集和分析所需的数据 C.方法(How):选择适当的分析技术和工具 D.结论(SoWhat):得出洞察并提出建议 134. 常用的数据分析模型或方法包括?(ABCD) A.对比分析:与目标、历史、同期、行业等进行对比 B.下钻/多维分析:从汇总数据深入到细节维度 C.归因分析:探究问题或结果产生的根本原因 D.漏斗分析:追踪用户从接触到转化的全过程转化效率 135. 数据分析中“数据质量”问题通常体现在哪些方面?(ABCD) A.数据缺失:关键字段存在空值 B.数据错误:数值明显不符合逻辑(如年龄为200岁) C.数据不一致:同一指标在不同来源中的数值不同 D.数据重复:同一条记录出现多次 136. 进行“对比分析”时,常见的对比维度有哪些?(ABCD) A.时间对比:同比、环比、与基期比 B.空间对比:不同区域、不同门店、不同部门 C.目标对比:实际值与预算值、目标值 D.基准对比:与行业平均水平、竞争对手、最佳实践对比 137. 以下哪些场景适合使用“下钻分析”?(ABC) A.发现公司总发电量下降,想查看是哪个大区导致的 B.发现某区域煤价下降,想查看是哪个省份、城市导致的 C.发现某公司利润率高,想查看具体由哪些SKU贡献 D.预测未来一年的新能源发展规模 第 96 页 共 140 页 138. 数据分析的五个常见层次(描述、诊断、预测等)中,属于“向后看”的分析 是?(AB) A.描述性分析:发生了什么? B.诊断性分析:为什么会发生? C.预测性分析:将来可能会发生什么? D.规范性分析:我们应该怎么做? 139. 以下哪些是“诊断性分析”(归因分析)可能用到的具体方法?(ABC) A.下钻分析:定位问题发生的具体维度 B.相关性分析:寻找与问题指标高度相关的其他因素 C.细分/分群分析:比较不同群体的表现差异 D.趋势预测:建立时间序列模型 140. 数据分析师在项目初期进行“探索性数据分析(EDA)”时,通常会做哪些 事?(ABC) A.计算关键指标的基本统计量(均值、中位数、标准差) B.绘制数据的分布图、箱线图以发现异常值 C.查看数据表的行列数量、字段类型 D.立即建立复杂的机器学习模型 141. 一个“好”的分析指标(Metric)应具备哪些特征?(ABCD) A.可量化:能够被准确测量和计算 B.可行动:指标的变动能清晰地指向需要采取的行动 C.相关性:与核心业务目标紧密相关 D.简单易懂:容易被业务团队理解和沟通 142. 在分析过程中,发现数据结论存在“幸存者偏差”,这可能是因为?(ABD) A.只分析了目前活跃的用户,而忽略了已流失的用户 B.只收集了成功案例的数据,而忽略了失败案例的数据 C.样本数据随机抽取,能代表整体情况 D.分析的客户都是上个月完成购买的,而这个月未购买的客户未被包含 143. 数据分析报告中的“可视化图表”,选择原则包括?(ABD) A.服务于分析目的和要传达的信息 B.根据数据的类型(分类、时序、分布等)选择最合适的图表 C.越复杂、越炫酷的图表越好 D.保持简洁,避免不必要的装饰元素干扰信息传递 144. 以下哪些做法有助于培养和提升“数据思维”?(ABC) A.在遇到业务问题时,习惯性追问“有没有数据可以验证或说明这个问题?” 第 97 页 共 140 页 B.在做决策时,尝试寻找数据作为支撑,而不是仅凭感觉 C.定期复盘业务数据,主动发现异常或趋势 D.只关注数据报表的最终数字,不关心其计算过程和背景 145. 在构建一个业务监控仪表板时,选择核心监控指标应考虑?(ABC) A.指标数量宜精不宜多,聚焦最关键的业务脉搏 B.指标应能反映业务的核心目标(如收入、成本、效率) C.指标最好是“结果指标”和“过程指标”相结合 D.把所有能计算出来的指标都放上去,以防遗漏 146. 数据分析中“假设检验”的思维是指?(ABD) A.先对业务问题提出一个可能的假设(如“新版本提高了用户留存”) B.然后设计分析或实验来验证这个假设是否成立 C.无论数据结果如何,都坚持最初的假设 D.这是一种将业务问题转化为可验证命题的科学方法 147. 关于“数据驱动”文化,正确的描述是?(ABD) A.鼓励基于数据和事实进行讨论和决策 B.允许有不同的观点,但最终应以客观数据作为评判依据 C.意味着数据分析师可以替代业务部门做决策 D.需要公司从制度、工具和培训上给予支持 148. 在数据分析项目的收尾阶段,除了提交报告,还应该做哪些事以确保分析价 值落地?(ABC) A.与业务方共同回顾分析结论,确认理解一致 B.跟踪建议措施的落地情况和后续效果 C.将分析过程中形成的可复用的数据模型或看板进行文档化和移交 D.立即开始下一个分析项目,无需回顾 149. OKR 模型的核心特征包括?(ABD) A.O 是定性的方向性目标 B.KR 是定量的关键成果 C.KR 数量越多越好 D.O 和KR需对齐业务核心价值 150. OSM 模型的三个核心要素包括?(ABC) A.Objective(目标) B.Strategy(策略) C.Measure(度量) D.Method(方法) 第 98 页 共 140 页 151. 指标五要素包括以下哪些内容?(ABCD) A.时间 B.维度 C.度量 D.条件 152. 选择北极星指标的原则包括?(ABCD) A.与核心业务价值强相关 B.可衡量,可追踪 C.相对稳定,不频繁变更 D.能反映用户核心需求 153. 数据分析的核心思维包括?(ABC) A.对比思维 B.拆解思维 C.归因思维 D.工具思维 154. 以下哪些属于对比分析的常见参照系?(ABC) A.目标值 B.历史值 C.行业标杆值 D.随机数值 155. 拆解北极星指标的常用方法包括?(ABC) A.用户旅程漏斗拆解 B.数学公式拆解 C.业务维度拆解 D.随机挑选拆解 156. 一个有效的指标体系应具备的特征包括?(ABC) A.全面性:覆盖核心业务维度 B.层级性:按目标-维度-指标分层 C.可操作性:能指导业务行动 D.杂乱性:指标越多越全面 157. 数据驱动决策的优势包括?(ABC) A.减少主观偏见 B.基于客观事实 C.提高决策效率 第 99 页 共 140 页 D.完全替代经验判断 158. 以下哪些属于数据分析中常见的思维误区?(ABD) A.幸存者偏差:只关注成功案例 B.因果混淆:将相关当作因果 C.对比思维:找数据差异 D.指标口径不一致:同一指标计算规则不同 159. 在OSM模型中,策略(S)的设计应遵循的原则包括?(ABC) A.紧扣目标(O) B.具有可执行性 C.与度量(M)联动 D.越多越好 160. 以下哪些指标属于监控性指标的特征?(ABD) A.可量化,可定期跟踪 B.与核心目标强相关 C.定性描述,无法测量 D.能及时发现异常 161. 数据分析中迭代思维的应用场景包括?(ABD) A.基于初步结论优化分析框架 B.补充数据验证假设 C.一次分析得出最终结论 D.根据业务反馈调整指标 162. 假设验证思维的步骤包括?(ABC) A.提出合理假设 B.收集数据验证 C.分析验证结果 D.坚持初始假设不改变 163. 以下哪些做法能避免数据误导?(ABC) A.结合业务背景解读数据 B.确保指标口径统一 C.识别数据局限性(如样本偏差) D.盲目相信数据表面值 164. 以下哪些属于对比思维的应用场景?(ABC) A.实际发电量与目标发电量对比 B.本季度数据与上季度数据对比 第 100 页 共 140 页 C.本公司数据与行业标杆对比 D.孤立分析单个指标 165. 北极星指标与辅助指标的关系包括?(ABC) A.辅助指标支撑北极星指标达成 B.北极星指标是核心方向 C.辅助指标是北极星指标的拆解 D.两者无关联 166. 数据分析思维与工具操作的区别在于?(ABC) A.思维聚焦"为什么"和"做什么" B.工具聚焦"怎么做" C.思维是核心,工具是手段 D.工具比思维更重要 167. 数据安全为何重要?(ABC) A.数据是核心战略资产 B.国家法律法规的刚性要求 C.企业面临现实的内外部风险 D.增加了员工的工作趣味性 168. 国家数据安全核心法律“三驾马车”包括?(BCD) A.《保守国家秘密法》 B.《网络安全法》 C.《数据安全法》 D.《个人信息保护法》 169. 数据全生命周期主要包括哪些环节?(ABCD) A.采集 B.存储与传输 C.使用与分享 D.归档与销毁 170. 数据安全事件可能造成的后果包括?(ABCD) A.经济损失 B.声誉受损 C.法律责任 D.运营中断 171. 员工在日常工作中,应警惕的高频风险场景包括?(BCD) A.使用授权加密邮件传输文件 第 101 页 共 140 页 B.通过微信、网盘传输敏感文件 C.远程办公使用个人设备处理工作 D.对外合作未经审批提供数据 172. 数据安全防护的基础技术手段包括?(ABD) A.加密技术 B.访问控制(如RBAC) C.防泄漏系统(DLP) D.脱敏技术 173. 发生数据安全事件时,正确的报告和处置步骤包括?(AC) A.立即向本部门负责人报告 B.隐瞒不报,自行处理 C.隔离影响系统,防止扩散 D.擅自删除相关证据 174. 数据使用与分享环节的安全管控要点包括?(BD) A.权限最大化 B.权限最小化,操作留痕 C.无需审批,自由分享 D.分级审批,签订安全协议 175. 员工在数据安全中的角色和责任包括?(AC) A.数据安全最直接的“守护者” B.与己无关的旁观者 C.业务数据管理的主体责任部门成员 D.仅需执行领导命令,无需知晓原理 176. 警示案例给我们的教训包括?(BC) A.敏感数据可以存储于个人云盘方便工作 B.数据安全责任无法外包,需审计第三方 C.严格的权限管理与审计是防止内鬼的关键 D.只要数据不涉及个人,风险就小 177. 关于数据出境,以下说法正确的是?(ABD) A.是法律规定的红线,必须谨慎对待 B.任何涉及数据出境的情况都需要安全评估审批 C.员工个人信息出境无需特别管理 D.依据是《数据出境安全评估办法》 第 102 页 共 140 页 178. 员工参与共建数据安全防线的行动建议包括?(ABC) A.自我核查工作习惯 B.持续学习安全知识 C.积极报告安全隐患 D.只关注本职工作,不理会他人行为 179. 数据安全审计平台的功能主要是?(BC) A.实时阻断所有访问 B.记录所有数据操作 C.对操作记录进行分析 D.自动加密数据 180. 智能助手可以监听哪些触发事件?(ABCD) A.表单数据提交 B.表单数据被编辑 C.流程到达某个节点 D.流程回退到某个节点 181. 以下哪些功能可以有效提升表单数据的质量和规范性?(ABCD) A.字段校验(如必填、数字范围) B.下拉框/单选按钮组(限制输入选项) C.数据联动(自动填充标准信息) D.公式编辑(自动计算,避免人工算错) 182. 关于数据联动与关联查询,以下哪些描述是正确的?(ABC) A.两者都需要设置一个关联条件(如匹配字段) B.数据联动会改变目标字段的值,关联查询不会 C.关联查询的结果通常以表格形式展示 D.数据联动只能在表单提交前生效 183. 在流程设计中,可以设置哪些类型的经办人?(ABCD) A.指定具体成员 B.指定部门(该部门所有成员) C.部门负责人 D.表单字段(动态指定) 184. 以下哪些是数据工厂的核心处理节点?(ABCD) A.横向连接 B.追加合并 C.分组汇总 第 103 页 共 140 页 D.字段设置 185. 仪表盘中可以添加哪些类型的图表组件?(ABCD) A.统计数字 B.柱状图 C.饼图 D.明细表 186. 在权限组管理中,字段权限可以控制什么?(AB) A.用户能否看到这个字段 B.用户看到字段后,能否修改其值 C.字段的值是否必填 D.字段的默认值是什么 187. 数据工厂的输出表可以用于哪些后续操作?(ABCD) A.作为另一个数据工厂的输入源 B.作为聚合表的数据源 C.直接绑定到仪表盘进行可视化 D.通过智能助手写回业务表单 188. 设置字段校验时,支持的校验规则包括?(ABCD) A.必填项校验 B.数字范围校验(大于、小于、介于) C.文本长度校验 D.正则表达式校验(如手机号格式) 189. 在数据表格中进行数据处理,可能涉及的典型步骤包括?(ABCD) A.数据清洗(如处理空值,异常值) B.数据转换(如新增列,类型转换) C.数据合并与关联 D.数据分组与聚合 190. 数据透视表可以实现以下哪些数据分析操作?(ABCD) A.对数值字段进行求和,计数,平均值等汇总 B.按行,列,页(筛选器)多个维度展示数据 C.对日期字段按年,季度,月进行自动分组 D.基于现有字段创建新的计算字段或计算项 191. 在图表美化中,以下哪些做法属于"消除杂乱元素"?(ABD) A.去除不必要的背景色和网格线 B.简化或合并过于复杂的图例 第 104 页 共 140 页 C.将简单的二维图表改为复杂的三维立体图表 D.优化坐标轴刻度和标签,使其更清晰 192. 以下哪些是单元格引用的正确类型?(ABC) A.相对引用(如A1) B.绝对引用(如$A$1) C.混合引用(如$A1或A$1) D.循环引用(如A1引用自身) 193. "条件格式"可以基于以下哪些方式设置规则?(ABCD) A.单元格值(大于,小于,介于等) B.特定文本(包含,等于) C.发生日期(昨天,本周,上月) D.空值或非空值 194. 以下哪些操作可以在"数据"选项卡下完成?(ABCD) A.排序和筛选 B.分列 C.删除重复项 D.数据验证 195. 在制作专业的数据报告时,关于图表的使用,以下哪些原则是正确 的?(ABCD) A.选择合适的图表类型来匹配要传达的信息(比较,趋势,构成,关系) B.保持图表简洁,消除所有不必要的装饰元素 C.确保坐标轴标签,数据标签,图例清晰无误 D.为重要的图表添加简短的文字标题或结论性标注 196. 以下哪些是数据清洗中常见的处理任务?(ABCD) A.处理缺失值(如填充或删除) B.处理重复值 C.处理格式不一致问题(如日期格式,文本数字) D.处理逻辑错误(如年龄为负数) 197. "快速分析"工具(选中数据后右下角出现)可以提供哪些快速操作?(ABCD) A.快速应用条件格式 B.快速插入图表 C.快速插入数据透视表 D.快速插入迷你图 第 105 页 共 140 页 198. 关于"切片器"和"日程表",以下描述正确的是?(ABCD) A.两者都是用于数据透视表和表格的视觉筛选工具 B.切片器可以用于任何字段,而日程表专门用于日期字段 C.一个切片器可以同时控制多个数据透视表 D.日程表可以按年,季度,月,日等粒度进行筛选 199. 以下哪些功能有助于提高数据输入的准确性和效率?(ABCD) A.数据验证(设置下拉列表或输入范围) B.单元格的"自动更正"选项 C.使用公式进行自动计算 D.保护工作表,防止误修改 200. 在数据表格中,能够实现多表数据关联或合并的分析功能有?(ABCD) A.数据透视表(使用多表数据模型) B.Power Query(获取和转换数据) C.VLOOKUP 函数 D.合并计算 第 106 页 共 140 页 三、判断题 1. 自助数据集创建后,如果原始数据更新,自助数据集的结果会自动同步更新。 (√) 2. 参数控件只能用于筛选数据,无法实现动态切换分析指标。(×) 3. 多表关联时,左合并会保留左表的所有记录,右表只保留匹配上的记录。(√) 4. 漏斗图只能展示流程的转化情况,无法显示具体的转化数值。(×) 5. 数据过滤只能在数据准备阶段进行,组件层面无法单独设置过滤条件。(×) 6. DEF 函数的语法格式为DEF(聚合指标,[分组维度],[过滤条件]),其中分组维 度和过滤条件为可选参数。(√) 7. 制作仪表板时,可以通过“固定位置”功能让某个组件始终显示在屏幕可视区 域,不随滚动条移动。(√) 8. 散点图的X轴和Y轴必须是数值型指标字段,无法使用维度字段。(√) 9. 交叉表只能展示维度和指标的交叉汇总结果,无法展示明细数据。(×) 10. 数据分析的唯一目的就是验证领导或业务方提出的假设。(×) 11. 对比分析是数据分析中最基本、最重要的思路之一,没有对比,就难以评估好 坏、发现问题。(√) 12. 在分析报告中,只要数据准确,图表美观,即使结论模糊或缺乏业务建议,也 算是一份合格的分析报告。(×) 13. 数据分析师可以完全依赖工具自动分析,不需要深入理解业务背景。(×) 14. 归因分析的目标是找到一个且唯一一个导致问题的根本原因。(×) 15. 在分析初期,进行探索性数据分析(EDA)的主要目的是为了直接得出最终结 论。(×) 16. 所有业务问题都可以且应该通过数据分析来解决。(×) 17. 数据分析的逻辑链条应该是:业务问题->数据收集->分析建模->结论建议。 (√) 18. 在制作图表时,数据的性质(如分类数据、时间序列数据、分布数据)是选择图 表类型的首要考虑因素。(√) 19. “下钻分析”和“多维分析”是同一个概念,都是指从不同维度查看数据。 (×) 20. 一个优秀的数据分析结论,应该避免使用“可能”、“大概”等不确定词汇, 必须给出绝对肯定的判断。(×) 21. 经营分析看板上的指标越多、越全面,就越能帮助管理者掌握全局。(×) 22. 数据分析思维强调“用数据说话”,这意味着所有决策都必须有100%的数据 支持,不能有任何主观判断。(×) 第 107 页 共 140 页 23. 对于周期性强的业务(如零售、旅游),进行“同比”分析比“环比”分析通常 更有意义。(√) 24. 在分析报告中,对于同一个数据,使用饼图和环形图来表达,其传递的核心信 息是相同的。(√) 25. 数据可视化中,使用红色通常代表“良好”或“增长”,绿色代表“警告”或 “下降”。(×) 26. 一个数据分析项目成功的标志,是最终报告得到了业务领导的表扬。(×) 27. OKR 模型中,O是定量的数字目标,KR是定性的方向性描述。(×) 28. OSM 模型的核心是目标-策略-度量的闭环,确保策略能支撑目标,度量能评 估策略效果。(√) 29. 北极星指标是唯一需要关注的指标,无需设置辅助指标。(×) 30. 数据分析的起点是收集所有能获取的数据,再寻找分析方向。(×) 31. 指标五要素中的标准是对度量值的评价基准。(√) 32. 对比分析的核心是找到数据之间的差异,没有参照系的对比毫无意义。(√) 33. 拆解思维的核心是将复杂问题分解为多个独立的子问题,逐一分析。(√) 34. 数据驱动决策意味着完全不需要经验判断,只需依赖数据即可。(×) 35. 幸存者偏差是指只关注成功的样本,忽略失败的样本,导致结论失真。(√) 36. 指标口径不统一会导致数据不可比,影响分析结果的准确性。(√) 37. OSM 模型中的度量(M)是直接衡量最终目标(O)是否达成的指标。(×) 38. 数据分析思维的核心是使用复杂的工具和模型,而非逻辑分析。(×) 39. 北极星指标一旦确定就不能改变,需长期坚持。(×) 40. 归因分析的核心是找到导致结果的所有可能原因,无需区分主次。(×) 41. 先总后分的分析原则是指先分析总体数据,再细分到各个维度探究原因。 (√) 42. 有效的监控指标应少而精,聚焦核心业务目标,而非越多越好。(√) 43. 假设验证思维要求坚持初始假设,即使数据与假设矛盾也不调整。(×) 44. 对比分析只需要对比绝对数值差异,无需考虑相对变化幅度。(×) 45. 数据分析的终极目标是制作精美的可视化图表。(×) 46. OKR 中的KR应具有挑战性,完成度在70%左右是理想状态。(√) 47. 数据安全只是科技与数智化部等专业部门的事,普通员工无需过多关注。 (×) 48. 《数据安全法》规定,所有企业都必须设立专门的数据安全管理局。(×) 49. 数据分类分级后,公开级和核心级数据的保护措施可以完全相同。(×) 50. “一数一源”原则有利于保证数据一致性,减少重复录入和安全风险。(√) 第 108 页 共 140 页 51. 在集团内部,敏感数据可以通过微信传输,因为都是同事。(×) 52. 员工离职时,可以将自己创作的工作报告带走,因为这是个人智力成果。(×) 53. 只要数据不传给公司外部的人,在内部任何员工之间共享都是允许的。(×) 54. 数据安全事件发生后,应立即报告并尽可能保留证据,不要擅自删除。(√) 55. 《个人信息保护法》只适用于互联网公司,跟能源企业关系不大。(×) 56. 使用强密码并定期更换,是员工应遵守的基本安全行为规范。(√) 57. 数据安全防护只需要技术手段就够了,管理措施和人员意识不重要。(×) 58. 对外提供数据时,只要对方是长期合作单位,就可以省略审批和签订安全协 议的步骤。(×) 59. 数据销毁意味着从电脑上删除文件并清空回收站即可。(×) 60. 华电集团作为央企,其数据安全工作只需满足集团内部要求即可。(×) 61. 数据安全培训的目的是让员工知晓责任、规范行为、并能主动报告隐患。(√) 62. 所有数据都必须进行加密存储,无论其级别如何。(×) 63. 员工可以私自安装自己熟悉的软件到办公电脑上以提高工作效率。(×) 64. 数据安全应急预案只需制定一次,无需定期演练和更新。(×) 65. “四个谁”原则明确了数据安全责任的归属,有助于落实责任到人。(√) 66. 数据作为核心战略资产,其价值体现在能为企业创造竞争优势和商业价值。 (√) 67. 普通表单和流程表单的核心区别在于是否包含多节点审批流程。(√) 68. 数据联动功能会自动填充关联字段值,而关联查询仅用于只读查看,不改变 当前表单字段值。(√) 69. 聚合表的数据会实时同步源表单数据变化。(×) 70. 智能助手支持定时触发,可实现每天固定时间发送数据报告。(√) 71. 流程设计中,一个节点只能设置一个经办人。(×) 72. 字段校验规则仅在表单提交时生效,审批节点修改数据时不生效。(×) 73. 数据工厂的横向连接节点要求两张表字段结构完全一致。(×) 74. 子表单字段适用于记录一条主记录对应的多条明细数据(如订单商品明细)。 (√) 75. 流程表单的表单状态字段由系统自动维护,无需用户手动填写。(√) 76. 数据工厂的追加合并节点最多可拼接10张结构相同的数据表。(√) 77. 关联数据字段可选择多条记录并带回其字段值到当前表单。(√) 78. 权限组中的数据权限控制用户能查看和操作的数据记录范围(如仅看自己提 交的)。(√) 79. 表单提交校验功能可防止用户重复提交相同内容的记录。(√) 第 109 页 共 140 页 80. 数据工厂的字段设置节点可基于已有字段计算新字段(如通过单价和数量计 算金额)。(√) 81. 批量导入数据表格数据时,下拉框字段需填写选项的编码而非显示文本。 (×) 82. 仪表盘的数据源仅支持聚合表,不支持原始表单或数据工厂输出表。(×) 83. 在数据表格中,公式必须以等号(=)开头。(√) 84. 使用"填充柄"向下拖动填充序列"一月,二月,三月"时,需要按住Ctrl键。 (×) 85. "条件格式"功能可以根据指定条件自动设置单元格的格式,如颜色,字体等。 (√) 86. 在单元格中输入文本型数字(如身份证号),最可靠的方法是先将单元格格式 设置为"文本",再输入数字。(√) 87. 数据透视表创建后,如果源数据发生变化,数据透视表会自动更新。(×) 88. "切片器"是一种可以快速,直观地对数据透视表或图表进行筛选的交互式工 具。(√) 89. 函数=RANK.EQ(A2, $A$2:$A$10, 0)可以计算A2 单元格在A2:A10区域中的 降序排名。(√) 90. VLOOKUP 函数只能从左向右查找,即查找值必须位于查找区域的第一列。 (√) 91. 使用"分列"功能只能根据分隔符号(如逗号,空格)来拆分数据。(×) 92. 在数据透视表中,可以通过"值字段设置"将数值的汇总方式从"求和"改为" 平均值"。(√) 93. 折线图最适合用于比较不同类别项目之间的数值大小。(×) 94. 饼图适合用于展示超过7个以上类别的数据构成比例。(×) 95. 在公式=SUM(B2:E2)*F2中,数据表格会先计算B2到E2的和,再乘以F2。(√) 96. "数据验证"(数据有效性)功能可以限制单元格中输入的内容类型或范围,例 如只允许输入1-100之间的整数。(√) 97. 在数据表格中,单元格区域"A1:C3"共包含6个单元格。(×) 98. 使用"冻结窗格"功能可以固定表格的某一部分(如标题行),使其在滚动时保 持可见。(√) 99. 在图表中,为了突出显示关键数据点,最有效的做法是使用不同的颜色,形状 或添加数据标签进行高亮。(√) 100. 在数据表格中,所有数据清洗操作(如删除重复值,分列)都必须在"开始" 选项卡下完成。(×) 第 110 页 共 140 页 101. 数据资产编目是数据治理的基础工作,电力企业应将营销、运检等专业数 据纳入统一目录管理。(√) 102. 在电力数据治理中,数据质量只需关注准确性,无需考虑一致性和完整性。 (×) 103. 元数据管理能够帮助电力一线员工理解数据含义,是消除“数据孤岛”的 关键环节。(√) 104. 对电力负荷数据进行时序分析时,季节性特征和趋势特征是必须考虑的重 要因素。(√) 105. 在电力设备状态监测中,异常检测算法可以帮助运维人员及时发现潜在故 障隐患。(√) 106. 构建电力设备缺陷识别数据集时,数据增强技术(如旋转、裁剪)可用于 扩充少数类样本。(√) 107. 从生产环境直接导出的原始数据无需清洗和标注,即可直接用于训练高精 度AI模型。(×) 108. 在构建电力专业问答数据集时,应引入专家知识进行人工校验,确保答案 的专业性。(√) 109. 电力行业数据交换标准应遵循国家及行业相关规范,如DL/T系列标准,以 确保互联互通。(√) 110. 模型开发过程中的代码规范不属于数据治理标准体系的覆盖范围。(×) 111. 《数据安全法》要求电力企业在处理用户用电信息时,必须采取加密、去 标识化等措施。(√) 112. 传统机器学习算法(如随机森林)在处理电力高维表格数据时,往往比深 度学习模型更具可解释性。(√) 113. AI 模型在电力系统的应用完全不需要人工干预,可以实现全自动化闭环控 制。(×) 114. 知识图谱技术可以有效整合电力设备台账、检修记录等多源异构数据,辅 助故障诊断。(√) 115. 电力垂类大模型通常需要在通用大模型基础上,利用电力专业语料进行增 量预训练或微调。(√) 116. RAG(检索增强生成)技术可以让大模型在回答电力运维问题时引用外部知 识库,提高准确性。(√) 117. 模型对抗攻击是指通过在输入数据中添加微小扰动,诱导模型输出错误结 果,威胁电网安全。(√) 118. 部署在内网的AI模型绝对安全,不会受到来自外部的数据投毒或模型窃取 第 111 页 共 140 页 攻击。(×) 119. 电力AI模型上线前,必须进行安全性评估,确保模型鲁棒性满足关键基础 设施安全要求。(√) 120. 在进行电力巡检图像识别时,卷积神经网络(CNN)通常是处理图像数据的 首选模型架构。(√) 121. 选择模型时,若电力业务场景对实时性要求极高,应优先考虑复杂度高、 参数量大的大模型。(×) 122. 针对电力营销文本分类任务,选择BERT等预训练语言模型通常比传统的 TF-IDF 效果更好。(√) 123. 在电力设备故障预测模型评估中,召回率比准确率更重要,因为漏报故障 可能导致严重事故。(√) 124. 模型评估中的AUC值越接近1,说明模型的分类性能越好,适用于评估电 力风险预警模型。(√) 125. 模型在测试集上的表现可以直接代表其在真实复杂电网环境中的最终运行 效果。(×) 126. 混淆矩阵可以直观展示模型在各类电力工况下的分类对错情况,是重要的 评估工具。(√) 127. 人工智能工程化的核心是将模型从实验室环境迁移到生产环境,电力企业 需建立完善的MLOps流程。(√) 128. 在电力数据分级分类管理中,涉及电网核心运行状态的数据通常应定为较 高密级,严禁未经授权的外部共享。(√) 129. 数据治理过程中,元数据管理仅指对数据库表结构的技术定义,不包含业 务含义和规则的描述。(×) 130. 在电力设备状态检修数据分析中,时序分析技术可用于挖掘设备监测数据 随时间变化的趋势与周期性。(√) 131. 构建电力巡检图像识别数据集时,为了提高模型泛化能力,应尽可能增加 样本的多样性,覆盖不同光照与角度。(√) 132. 大语言模型(LLM)的“幻觉”现象是指模型生成的内容看似流畅合理,但 实际上违背事实或逻辑。(√) 133. 在模型选型时,针对边缘侧终端(如巡检机器人)部署,应优先考虑参数 量小、推理速度快的轻量化模型。(√) 134. 模型评估中,准确率是分类模型的重要指标,但在正负样本极度不平衡时, 它不能真实反映模型性能。(√) 135. 对训练数据中的用户敏感信息进行脱敏处理,是防止电力AI模型泄露隐私 第 112 页 共 140 页 数据的重要安全手段。(√) 136. 提示词工程是一种通过调整模型内部参数来优化大模型输出效果的技术。 (×) 137. 电力垂类大模型通常需要在通用大模型基础上,利用电力行业专业知识进 行增量预训练或指令微调。(√) 138. 监督学习需要使用带有标签的数据进行训练,而电力设备故障预测常用无 监督学习发现未知故障模式。(√) 139. 模型对抗攻击是指通过在输入数据中添加人眼难以察觉的微小扰动,诱导 模型输出错误结果。(√) 140. 在构建电力营销数据集时,若存在大量缺失值,直接删除所有含缺失值的 行是处理数据质量问题的最佳方法。(×) 141. 人工智能三要素是数据、算力和算法,其中高质量的行业数据是决定电力 AI 模型性能上限的关键基础。(√) 142. 模型在训练集上表现优异,但在测试集或实际电网环境中表现较差,这种 现象称为欠拟合。(×) 143. RAG(检索增强生成)技术结合了检索系统和大模型,能有效缓解大模型在 电力专业知识问答中的幻觉问题。(√) 144. 在电力系统网络安全防护中,AI模型文件本身也可能成为攻击载体,因此 需对模型文件进行安全检测。(√) 145. 迁移学习可以利用在大型通用数据集上预训练的模型,通过微调快速适应 电力特定场景的小样本任务。(√) 146. 数据分析报告中,可视化图表的主要作用是美化版面,对辅助决策人员理 解电网运行态势没有实质帮助。(×) 147. 针对电力调度辅助决策等高风险场景,模型的可解释性是选型时的重要考 量指标,以增强调度员信任。(√) 148. 标准化建设滞后不会影响电力企业内部的数据共享与AI模型的跨部门推 广应用。(×) 149. 知识图谱技术可以将电力设备、故障现象、处置预案等分散信息关联起来, 辅助进行智能故障诊断。(√) 150. 在模型全生命周期管理中,模型上线部署后由于电网运行环境变化,需定 期监控性能并进行迭代更新。(√) 151. 选择模型算法时,模型结构越复杂、参数量越大,在电力业务场景中的实 际应用效果一定越好。(×) 152. 数据集构建中的数据标注工作质量直接影响模型训练效果,因此需建立严 第 113 页 共 140 页 格的多轮审核机制。(√) 153. 人工智能模型在电力系统的应用完全不需要人工干预,可以完全替代人工 进行所有调度决策。(×) 154. 数据资产目录编制是数据治理的重要环节,有助于电力业务人员快速查找 数据。(√) 155. 在电力数据质量管理中,完整性是唯一需要关注的维度,准确性可以忽略。 (×) 156. 对电力负荷数据进行时序分析时,不需要考虑季节性因素和趋势性因素。 (×) 157. 相关性分析可以揭示变量间的关联程度,但无法证明变量间存在因果关系。 (√) 158. 在电力营销数据分析中,可视化图表仅用于美观,对决策支持没有实际价 值。(×) 159. 构建电力设备缺陷识别数据集时,数据增强技术(如旋转、裁剪)可用于 扩充样本。(√) 160. 在构建训练数据集时,测试集的数据可以直接从训练集中抽取,无需完全 独立。(×) 161. 针对电力用户敏感信息,在构建数据集前必须进行数据脱敏处理以保障隐 私安全。(√) 162. 电力行业数据交换标准DL/T890系列属于企业内部标准,不具备行业通用 性。(×) 163. 在AI模型开发中,遵循《信息安全技术 机器学习模型安全评估规范》是 合规要求之一。(√) 164. 集团公司制定的数据标准只约束开发人员,对业务人员录入数据的格式无 约束力。(×) 165. 传统机器学习算法(如随机森林)在处理电力设备海量非结构化图像数据 时,通常优于深度学习算法。(×) 166. 人工智能在电力系统的应用场景中,输电线路无人机巡检主要应用了计算 机视觉技术。(√) 167. 监督学习算法在训练过程中不需要任何标注数据,可自动从数据中学习规 律。(×) 168. 大模型的“幻觉”现象是指模型生成的内容看似合理但实际上不符合事实 或逻辑。(√) 169. 大模型的参数量越大,其在特定电力专业任务上的表现一定越好,不存在 第 114 页 共 140 页 边际效应递减。(×) 170. 模型对抗攻击是指通过在输入数据中添加微小扰动,诱导模型输出错误结 果。(√) 171. 部署在变电站边缘侧的AI模型,由于环境封闭,完全不需要考虑模型窃取 风险。(×) 172. 训练数据中存在的偏见会直接导致AI模型输出结果存在偏见,影响决策公 平性。(√) 173. 在电力移动巡检终端上部署AI模型时,应优先选择参数量大、计算复杂的 模型以保证精度。(×) 174. 模型选型时,若业务对实时性要求极高(如继电保护),应优先考虑推理 延迟而非单纯追求高准确率。(√) 175. 开源大模型可以直接用于处理电力核心涉密业务,无需进行额外的安全合 规评估。(×) 176. 神经网络模型中的过拟合现象是指模型在训练集表现优异,但在测试集表 现较差。(√) 177. 数据清洗是数据预处理的关键步骤,缺失值处理通常只能采用删除整行记 录的方法。(×) 178. 数据治理的核心是提升数据质量,保障数据可用。(√) 179. 非结构化数据无法进行数据分析。(×) 180. 描述性分析主要回答“发生了什么”,而诊断性分析则致力于回答“为什 么会发生”。(√) 181. 数据集构建过程中,数据标注的一致性越高,模型训练的效果越好,因此 需要建立统一的标注规范并对标注人员进行专业培训。(√) 182. 数据标准规范中的数据编码规范,只需统一编码格式即可,无需考虑编码 的可扩展性和兼容性。(×) 183. 监督学习算法需要标注好的训练数据。(√) 184. 数据预识别是数据标注流程中的一个可选步骤,可以完全依赖人工标注。 (×) 185. 人工智能中的强化学习算法,通过与环境交互获得奖励或惩罚,不断调整 自身策略,最终实现特定目标的优化。(√) 186. 大模型的参数量越大,模型性能一定越好。(×) 187. 模型安全中的“模型窃取”风险,主要是指攻击者通过多次调用模型接口, 反向推导模型的参数和结构,从而复制模型。(√) 188. 数据标准规范只需要技术部门遵守,业务部门无需参与。(×) 第 115 页 共 140 页 189. 数据分类分级规范是数据安全的基础,它根据数据的敏感程度和价值对数 据进行分类和分级管理。(√) 190. 机器学习中的半监督学习算法,结合了监督学习和无监督学习的特点,仅 需要少量标注数据和大量未标注数据即可完成模型训练。(√) 191. 模型安全仅需关注模型本身,与训练数据无关。(×) 192. 数据分析的第一步是数据清洗。(×) 193. 大模型的轻量化部署,主要是通过模型压缩、量化等技术,在不降低模型 性能的前提下,减少模型的参数量和计算量,适配边缘设备。(√) 194. 数据脱敏技术中的加密法,分为对称加密和非对称加密,其中非对称加密 的安全性更高,适合用于敏感数据的长期存储。(√) 195. 人工智能就是机器学习,两者没有区别。(×) 196. 大模型的多模态融合,是指将文本、图像、音频、视频等多种类型的数据 统一输入模型,实现多维度的信息理解和生成。(√) 197. 人工智能的发展阶段中,弱人工智能只能处理特定领域的任务,而强人工 智能能够具备与人类相当的通用智能,目前已经实现商业化应用。(×) 198. 模型评估中,准确率越高,模型性能越好。(×) 199. 大模型的行业定制化,是指基于通用大模型,结合行业特定数据和业务需 求进行微调,使模型更适配具体行业的应用场景。(√) 200. 数据脱敏后的数据无法还原,确保数据安全。(√) 201. 聚类分析是一种无监督学习方法,其目标是将数据划分为不同的组,使得 组内数据相似度高,组间相似度低。(√) 202. 数据可视化是数据分析的最后一步,其主要目的是美化报告,对洞察的传 递作用有限。(×) 203. 无监督学习算法不需要训练数据,直接可以进行预测。(×) 204. 人工智能中的语音识别技术,其核心是将语音信号转换为文本,识别准确 率仅与模型性能有关,与语音的清晰度和环境噪音无关。(×) 205. 数据治理是一个一次性项目,完成后无需持续维护。(×) 206. 模型评估中的交叉验证,通过将数据集多次划分训练集和测试集,能够有 效避免单次划分带来的偶然性,提升评估结果的可靠性。(√) 207. 在数据分析中,异常值总是代表错误数据,应该被直接剔除。(×) 208. 数据质量的核心评估维度包括准确性、完整性和一致性。(√) 209. 模型选型时,应优先选择参数量最大的模型。(×) 210. 数据可视化的主要作用是美化数据呈现,与数据解读无关。(×) 211. 数据分析中的特征工程,是指对原始数据进行处理和转换,提取有效的特 第 116 页 共 140 页 征,其质量直接决定了模型的性能上限。(√) 212. 自然语言处理可以实现机器与人的自然对话。(√) 213. 数据治理中的数据存储,只需选择容量足够大的存储设备即可,无需考虑 数据的存储格式和访问效率。(×) 214. 数据脱敏技术中的替换法,替换后的虚假数据必须与原始数据的格式和分 布一致,才能保证数据的可用性。(√) 215. 数据安全防护的核心是防止数据泄露。(√) 216. 大模型训练不需要大量算力支持,普通电脑即可完成。(×) 217. 数据标准规范可以确保不同部门的数据格式一致,便于数据共享。(√) 218. 数据治理是一个系统性工程,需要业务、技术、管理等多部门协同配合, 才能实现数据价值的最大化。(√) 219. 数据增强技术主要用于增加数据集的数量和多样性,从而提高模型的泛化 能力。(√) 220. 数据生命周期管理规范涵盖了数据从创建、存储、使用、归档到销毁的全 过程。(√) 221. 机器学习算法的性能仅取决于算法本身,与训练数据无关。(×) 222. 数据治理的目标是将所有数据集中存储,无需分类管理。(×) 223. 在选择预训练模型进行迁移学习时,应尽量选择与目标任务领域相关的预 训练模型。(√) 224. 对抗样本攻击是通过在输入数据中添加微小的、人眼难以察觉的扰动,使 模型产生错误输出。(√) 225. 非结构化数据经过处理后可以转换为结构化数据。(√) 226. 开源模型总是优于商业闭源模型,因为其代码和参数可见,更易于定制和 优化。(×) 227. 模型压缩会降低模型性能,因此不建议使用。(×) 228. 人工智能的发展已经达到通用人工智能阶段。(×) 229. 大模型的训练成本极高,包括计算资源、数据准备和人力投入。(√) 230. 模型评估只需要关注模型的整体性能,不需要分析模型在不同数据子集上 的表现差异。(×) 231. 数据采集过程中,无需考虑数据的合法性和合规性。(×) 232. 大模型的上下文窗口大小决定了模型一次能处理的文本长度上限。(√) 233. 回归和分类都是有监督学习问题。(√) 234. 当训练数据较少时更容易发生过拟合。(√) 235. 回归函数A和B,如果A比B更简单,则A几乎一定会比B在测试集上表现 第 117 页 共 140 页 更好。(×) 236. 回归问题和分类问题都有可能发生过拟合。(√) 237. 如果一个训练好的模型在测试集上有100%的准确率,这意味着在一个新的 数据集上,也会有同样好的表现。(×) 238. Python 非常易于移植,无需修改便可以在各个平台运行。(√) 239. 参数分为顺序传入、关键词参数、默认参数、不定长参数。(√) 240. 函数可以根据返回值分为空值函数和无返回值函数。(×) 241. 回归和分类都是有无监督学习问题。(×) 242. 在电力数据治理中,数据质量管理的核心仅在于数据的准确性,而数据的 及时性、完整性和一致性不属于核心关注范畴。(×) 243. 针对电网设备监测数据的分析,时间序列分析法是一种常用且有效的手段, 可用于预测设备负荷变化趋势。(√) 244. 构建电力设备缺陷识别数据集时,为了模型训练效果,仅需大量收集正常 状态的样本,无需关注缺陷样本的平衡性。(×) 245. 根据《数据安全法》规定,电力行业属于关键信息基础设施运营者,其重 要数据在出境前必须通过安全评估。(√) 246. 人工智能算法在电力营销场景中的应用,可以完全替代人工进行客户服务, 无需保留人工介入机制。(×) 247. 大模型在处理电力专业领域的问答时,可能会产生“幻觉”现象,即生成 看似合理但实际上错误或不存在的信息。(√) 248. 在模型选型过程中,对于部署在变电站边缘侧的AI模型,应优先考虑模型 的轻量化和推理速度,而非单纯的精度。(√) 249. 模型评估指标中,准确率对于样本不平衡的电力故障检测数据集而言,可 能无法真实反映模型的性能,此时应结合召回率综合判断。(√) 250. 在进行电力用户用电行为分析时,必须对用户的敏感信息进行脱敏处理, 以符合隐私保护的相关标准规范。(√) 251. 模型安全不仅指模型运行时的稳定性,还包括防范对抗样本攻击,防止恶 意输入导致模型判断失误。(√) 252. 在数据集构建阶段,数据标注的质量直接决定了模型的上限,因此“Garbage In,Garbage Out”(垃圾进,垃圾出)是行业共识。(√) 253. 对于电力调度自动化系统产生的结构化数据,不需要进行数据清洗和预处 理即可直接用于大模型训练。(×) 254. 大模型的微调是指在预训练模型基础上,使用电力行业特定领域数据进行 进一步训练,以适应具体业务场景的过程。(√) 第 118 页 共 140 页 255. 电力集团的数据标准制定只需参考国际标准,无需结合企业内部实际情况 进行定制化调整。(×) 256. RAG(检索增强生成)技术结合了检索和生成的优势,可有效提升大模型在 电力知识库问答中的准确性和时效性。(√) 257. 在模型选型时,模型的参数量越大,其在电力业务场景中的实际应用效果 就一定越好。(×) 258. 数据治理的组织架构中,数据认责机制旨在明确各部门在数据产生、维护 和使用过程中的责任,保障数据质量。(√) 259. 人工智能模型在电力系统暂态稳定评估中的应用,属于安全关键型应用, 对模型的可靠性和可解释性要求极高。(√) 260. 构建电力设备红外测温数据集时,通过数据增强技术(如旋转、裁剪)可 以有效扩充数据规模,提升模型泛化能力。(√) 261. 为保障模型安全,对下载的开源预训练模型进行安全性扫描和后门检测是 上线前的必要步骤。(√) 262. 模型选型时,若业务场景对实时性要求极高(如继电保护),则不宜选用 推理延迟较大的复杂大模型。(√) 263. 在电力数据治理中,数据血缘分析能够追踪数据从源头到目标的流转过程, 有助于定位数据质量问题的根源。(√) 264. 电力营销系统的客户敏感信息在进行数据分析前,必须经过脱敏处理,这 符合数据治理中的安全性原则。(√) 265. 数据资产目录仅用于存储数据文件的物理路径,无法展示电力业务元数据 的含义,对数据查找无实际帮助。(×) 266. 在进行电力负荷预测分析时,时间序列数据通常存在趋势性和季节性特征, 预处理时需进行平稳化处理。(√) 267. 相关性分析可以量化电力设备运行参数之间的关联程度,若相关系数为0, 则说明两个参数之间没有任何关系。(×) 268. 在构建电力专业领域问答数据集时,直接使用互联网爬取的通用语料即可, 无需进行电力标准规范的专业清洗。(×) 269. 数据集标注的质量是决定AI模型性能上限的关键因素,对于电力设备图 像,需由专业人员进行精准标注。(√) 270. 电力行业作为关键信息基础设施运营者,在采购AI产品和服务时,必须符 合国家网络安全等级保护制度要求。(√) 271. 在电力AI应用开发中,遵循统一的数据交换接口标准,不利于不同厂商设 备之间的互联互通和数据共享。(×) 第 119 页 共 140 页 272. 《数据安全法》规定,电力企业开展数据处理活动应当依照法律、法规的 规定,建立健全全流程数据安全管理制度。(√) 273. 神经网络的层数越深、参数越多,模型在电力业务场景下的表现一定越好, 不存在计算资源浪费或过拟合风险。(×) 274. 迁移学习可以利用在通用大数据集上预训练的模型,通过微调快速适应电 力特定场景,减少训练时间和数据需求。(√) 275. 大模型的提示词工程对输出结果影响较小,在电力调度辅助决策应用中无 需优化提示词即可获得最佳效果。(×) 276. 电力大模型微调是指在预训练模型基础上,使用电力领域特定数据继续训 练,以适配具体业务场景的过程。(√) 277. 模型对抗攻击是指通过在输入数据中添加细微扰动,诱导电力设备识别模 型做出错误判断,这是模型安全风险之一。(√) 278. 数据投毒是模型安全威胁的一种,攻击者通过污染训练数据,可能导致电 力负荷预测模型产生系统性偏差。(√) 279. 在变电站边缘侧部署AI算法进行实时监测时,应优先选择轻量化、低延迟 的模型,而非参数量巨大的超大模型。(√) 280. 选择电力设备缺陷识别模型时,若对实时性要求极高,应优先考虑推理速 度,哪怕牺牲一定的模型精度。(√) 281. 对于电力企业内部非结构化文档的OCR识别任务,选择模型时只需关注准 确率,无需考虑模型对不同版式文档的泛化能力。(×) 282. 在评估电力窃电识别模型时,由于窃电样本属于少数类,仅看准确率指标 具有误导性,应重点关注召回率和F1分数。(√) 283. 混淆矩阵可以直观展示模型在各类别上的预测情况,是评估电力设备多分 类故障诊断模型的重要工具。(√) 284. 模型评估中的AUC值越接近0,说明模型区分正负样本的能力越强,适用 于电力风险预警模型的评价。(×) 285. 人工智能模型一旦在电力系统中上线运行,其性能将长期保持稳定,不需 要根据电网运行环境的变化进行持续监控。(×) 286. 在电力生产控制大区与管理信息大区之间部署AI模型时,必须严格遵守电 力监控系统安全防护规定,实施单向隔离。(√) 287. 自动化机器学习可以自动完成模型选择和超参数调优,能够降低电力一线 员工开发AI应用的门槛。(√) 288. 电力负荷预测通常采用时间序列分析方法,历史负荷数据的变化趋势是预 测未来负荷的重要依据。(√) 第 120 页 共 140 页 289. 构建电力设备故障识别数据集时,数据量越大模型效果越好,无需考虑样 本类别不平衡问题。(×) 290. 直接使用通用大语言模型处理电力调度指令,无需进行领域微调即可保证 指令解析的准确性和安全性。(×) 291. 模型安全不仅包括防范外部网络攻击,还包括防御对抗样本攻击,防止模 型被诱导输出错误的电力控制指令。(√) 292. 评估电力设备故障预测模型时,由于故障样本稀少,仅靠准确率指标无法 真实反映模型性能,需结合召回率综合评估。(√) 293. 构建电力设备红外热成像缺陷数据集时,数据标注工作必须由具备专业电 力知识的业务人员参与审核。(√) 294. 大模型在电力问答应用中可能会出现“幻觉”现象,即生成不符合电力规 程或事实的错误内容,需通过知识检索增强(RAG)缓解。(√) 295. 针对电力营销场景中的窃电嫌疑识别,由于缺乏大量已标注的窃电样本, 应优先考虑无监督学习的异常检测算法。(√) 296. 电力企业内部不同业务系统间的数据交互,必须遵循统一的数据接口规范, 以确保数据格式和语义的一致性。(√) 297. 在模型训练过程中,攻击者通过注入恶意数据来污染训练集,属于数据投 毒攻击,会严重影响模型推理的安全性。(√) 298. 数据治理贯穿数据全生命周期,包括数据采集、存储、加工、使用直至销 毁的全过程管理。(√) 299. 在电力APP中上线新的推荐算法前,通常采用A/B测试方式,对比新旧模 型在真实业务环境中的转化效果。(√) 300. 利用计算机视觉技术对无人机拍摄的杆塔图像进行分析,可以自动识别绝 缘子破损、鸟巢异物等常见缺陷。(√) 第 121 页 共 140 页 四、论述题 1. 简述数据分析的“四要素”及其在分析流程中的作用。 数据分析的四要素包括:目的、数据、方法、结论。 (1)目的(Why):是分析的起点,明确了要解决的业务问题或决策需求。 它决定了分析的方向、范围和最终的价值锚点。 (2)数据(What):是分析的基础原料。根据目的收集相关、准确、完整的 数据,是产出可靠结论的前提。 (3)方法(How):是分析的手段。根据目的和数据特点,选择合适的分析 模型、统计方法或可视化工具,将原始数据转化为信息。 (4)结论(So What):是分析的终点和产出。基于分析结果,提炼出对业 务问题的回答、核心洞察以及可执行的建议,完成从数据到价值的闭环。 2. 请列举至少三种常用的数据分析模型或思路,并简要说明其适用场景。 (1)对比分析:通过比较来评估表现、发现问题。适用于评估业绩(与目 标比)、监控异常(与历史比)、定位差距(与竞争对手比)等几乎所有场景。 (2)下钻/多维分析:从汇总数据深入到细节维度。适用于当发现总体 指标异常(如总销售额下降)时,需要定位具体责任区域、问题产品线或贡献 群体。 (3)归因分析:探究问题或结果产生的根本原因。适用于诊断业务痛点 (如用户流失率升高、利润率下滑)时,需要找出关键驱动因素。 (4)漏斗分析:追踪用户在一系列连续步骤中的转化与流失情况。适用 于优化业务流程(如电商购买流程、注册流程)和评估营销渠道效率。 (5)用户分群分析:将用户划分为具有不同特征的群体进行对比。适用 于精细化运营,针对不同群体(如新老客、高价值低价值用户)制定差异化策 略。 3. 简述“探索性数据分析(EDA)”的目的和通常包含的步骤。 (1)目的:在正式建模或测试假设之前,初步了解数据集的结构、质量、 分布和特征,发现潜在的模式、异常和关系,为后续深入分析提供方向和假 设。 (2)典型步骤: 1数据概览:查看数据维度(行数列数)、字段名称、类型和样例值。 2描述性统计:计算关键数值字段的中心趋势(均值、中位数)和离散 程度(标准差、极值)。 第 122 页 共 140 页 数据质量检查:识别缺失值、异常值、重复记录和不一致的数据。 3 4单变量分析:绘制单个变量的分布图(直方图、箱线图),了解其分布 形态。 5多变量关系探索:通过散点图矩阵、相关系数矩阵等,初步探索变量 间的关联性。 6初步洞察与假设形成:基于以上观察,形成关于数据模式或业务问题的 初步假设。 4. 请解释数据分析中“描述性分析”、“诊断性分析”和“预测性分析”三个层 次的区别。 这三个层次代表了数据分析的不同深度和价值: (1)描述性分析(发生了什么?):最基础的层次,旨在总结和描述历史数 据的现状和特征。回答“是什么”的问题。 (2)诊断性分析(为什么发生?):在描述性分析发现问题(如销售额下降) 后,深入探究其原因。回答“为什么”的问题。 (3)预测性分析(将来会怎样?):基于历史模式和关系,对未来可能发生 的情况进行预估。回答“将怎样”的问题。 5. 数据分析的三大核心思维是什么?请分别说明其内涵。 (1)对比思维:通过设置合理参照系(目标,历史,行业),找出数据之间 的差异,评估表现,发现问题。 (2)拆解思维:将复杂的业务问题分解为多个关联的子问题,或把核心 指标拆解为可操作的子指标,降低分析难度。 (3)归因思维:基于数据探究导致某一结果(如增长,下滑)的关键驱动 因素,回答“为什么”的问题。 6. 简述数据驱动决策的内涵,并说明其与经验驱动决策的区别。 (1)内涵:数据驱动决策是一种决策理念,强调在决策过程中以客观数 据和事实为重要输入,结合业务经验和判断,减少主观偏见和盲目性,提高 决策的科学性和成功率。 (2)核心区别: 1决策依据:数据驱动以数据和事实为核心依据;经验驱动以个人经 验,直觉和惯例为核心依据。 2可复制性:数据驱动的决策逻辑可追溯,可验证,可复制;经验驱动 第 123 页 共 140 页 的决策依赖隐性知识,难以复制和规模化。 (3)风险控制:数据驱动能有效识别潜在风险,降低决策不确定性;经 验驱动易受认知偏见影响,风险较高。 (4)适用场景:数据驱动适用于复杂多变,可量化的业务场景;经验驱 动适用于缺乏数据,需要快速决策的场景。 7. 什么是假设验证思维?请简述其在数据分析中的应用步骤。 (1)定义:假设验证思维是先基于业务经验和数据现象提出合理假设, 再通过数据收集,分析验证假设真伪,最终得出结论的思维方法,能避免盲 目数据分析,提高效率。 (2)应用步骤: 第一步:提出假设——基于业务问题和初步观察,提出具体,可验证的 假设(避免模糊假设); 第二步:设计验证方案——明确需要收集的数据,分析方法和判断标 准; 第三步:收集数据并验证——获取相关数据,通过对比,统计等方法验 证假设; 第四步:得出结论并迭代——若数据支持假设,则确认结论;若不支持, 则调整假设重新验证。 8. 请简述华电集团数据管理的四大原则及其核心含义。 华电集团数据管理遵循“统筹管理、分类分级、安全可控、充分利用” 四大原则: (1)统筹管理:集团层面统一规划、协调推进数据管理工作,避免各自 为政; (2)分类分级:按数据类别和重要程度划分等级,实现差异化管理; (3)安全可控:这是首要原则,确保数据全生命周期安全,无安全则无 一切; (4)充分利用:在安全可控前提下,最大化发挥数据的战略资产价值。 9. 简述数据全生命周期安全管控包含哪些核心环节,以及每个环节的关键管控 要求。 数据全生命周期安全管控核心环节及要求: (1)采集:遵循“一数一源”原则,确保数据来源唯一、准确; 第 124 页 共 140 页 (2)存储与传输:存储按分级加密(敏感级以上强制加密),传输使用 VPN/加密信道,禁止明文传输敏感数据; (3)使用与分享:使用遵循权限最小化、操作留痕;分享需分级审批、 签订安全协议、采取脱敏等措施; (4)归档与销毁:归档需安全存储,销毁需物理粉碎或安全擦除,记录 销毁证据。 10. 请说明《员工数据安全行为“十不准”》中至少5条核心禁止行为。 核心禁止行为(任选5条即可): (1)不准将内部数据存储于个人电脑、手机、云盘; (2)不准在公共场合、社交平台谈论公司敏感数据; (3)不准使用弱口令或共享账号密码; (4)不准点击来源不明的链接或邮件附件; (5)不准通过非授权渠道(微信/QQ/网盘)传输敏感文件; (6)不准私自安装未经审批的软件; (7)不准隐瞒或迟报已发生的数据安全事件; (8)不准在离职后保留或带走公司任何数据; (9)不准未经审批向外部提供公司数据; (10)不准随意丢弃包含数据的存储介质。 11. 发生数据安全事件后,员工应遵循哪些正确的报告和处置步骤? 正确步骤: (1)立即报告:第一发现人首先向本部门负责人报告,再由部门负责人 向科技与数智化部报告,严禁隐瞒不报; (2)初步处置:隔离影响系统/设备,断开网络防止风险扩散;保留日 志、截图等相关证据,不擅自删除文件或数据; (3)配合调查:按照科技与数智化部要求,提供事件相关信息,配合开 展溯源和处置工作; (4)事后整改:参与事件复盘,落实整改要求,避免同类事件再次发生。 12. 请简述“四个谁”责任原则的具体内容及其在数据安全管理中的作用。 (1)“四个谁”原则内容:谁主管谁负责、谁运行谁负责、谁使用谁负 责、管业务必须管安全; (2)核心作用:明确数据安全责任的归属,将责任落实到具体部门和个 第 125 页 共 140 页 人,避免“人人有责却人人无责”的情况,强化全员数据安全责任意识, 推动数据安全管理要求落地执行。 13. 数据分类分级的核心目的是什么?员工在日常工作中应如何落实分类分级 要求? (1)核心目的:避免“一刀切”的保护方式,实现对不同类别、不同级 别数据的差异化、精细化保护,在保障安全的前提下提高数据使用效率; (2)员工落实要求:识别本岗位接触的数据类别与级别;按对应级别遵 守存储、传输、使用等管控要求;发现数据分级不当或保护措施不到位时 及时反馈。 14. 简述国家数据安全核心法律“三驾马车”的名称及各自核心规范重点。 “三驾马车”指《网络安全法》《数据安全法》《个人信息保护法》: (1)《网络安全法》:侧重网络空间整体安全,规范网络运营者行为, 确立网络安全等级保护制度; (2)《数据安全法》:全面规范数据处理活动,建立数据分类分级保护、 风险评估、出境安全评估等核心制度; (3)《个人信息保护法》:聚焦个人信息保护,确立告知同意、最小必 要、个人信息出境等核心规则。 15. 员工在远程办公场景下,应遵守哪些数据安全要求? (1)设备要求:使用公司授权设备,禁止使用个人设备处理敏感数据; (2)网络要求:必须通过集团VPN/虚拟桌面接入内网,禁止连接公共 Wi-Fi 处理工作; (3)传输要求:使用加密邮件/授权平台传输文件,禁止通过微信/QQ等 非授权渠道传输敏感数据; (4)存储要求:工作数据仅存储在公司授权存储介质,不存储于个人云 盘/设备。 16. 数据作为企业核心战略资产,其价值体现在哪些方面?为何说数据安全是 数字化转型的前提? (1)数据价值:支撑企业科学决策、提升运营效率、驱动业务创新、增 强市场竞争优势; (2)数据安全是数字化转型前提的原因:数字化转型依赖数据的全面应 第 126 页 共 140 页 用,若数据安全无法保障,会导致数据泄露、丢失、滥用等问题,造成经 济损失、声誉受损甚至法律责任,直接阻碍转型进程,无安全则无数字化 转型和高质量发展。 17. 简述数据透视表的主要功能。 主要功能: 数据透视表是数据表格中强大的交互式数据汇总和分析工具。 它允许用户通过拖放字段,从不同维度(行,列,筛选器)对数据进行动态的排序, 筛选,分组和聚合计算(如求和,计数,平均值等),从而快速从海量数据中提炼 出有价值的信息。 18. 请说明VLOOKUP函数与INDEX+MATCH函数组合在查找数据时的主要区别和各 自的优势。 (1)VLOOKUP 函数: 区别:只能进行从左向右的查找,即查找值必须位于查找区域(table_array) 的第一列。 优势: 语法相对简单,易于学习和使用,对于简单的从左向右查找场景非常 高效。 (2)INDEX+MATCH 函数组合: 区别: 可以进行任意方向的查找(左,右,上,下)。MATCH函数定位查找 值的位置(行号或列号),INDEX函数根据这个位置返回对应单元格的值。 优势: 1灵活性高:不受查找方向限制; 2稳定性好:在表格中插入或删除列时,通常比VLOOKUP更不容易出错; 3效率可能更高:对于大型数据集,计算速度更快。 19. 什么是“条件格式”?请举例说明两种常用的条件格式规则及其在数据分析 中的作用。 (1)定义: 条件格式是一种根据单元格内容或公式计算结果,自动应用 预设格式(如颜色,图标,数据条)的功能。 (2)举例与作用: 突出显示单元格规则: 例如,将销售额大于10000的单元格设置为绿色背 景。作用: 快速识别出超过目标,低于阈值或满足特定条件的异常值或关键数 据。 (3)数据条/色阶: 例如,在“销售数量”列使用数据条,长度代表数值 第 127 页 共 140 页 大小。作用: 提供直观的视觉对比,无需仔细阅读数字就能一眼看出数据 的相对大小和分布情况,便于进行快速比较和排序。 20. 在数据表格中,处理一份从系统导出的,格式混乱的原始数据表,通常需要进 行哪些数据清洗步骤?(请列出至少四项) (1)删除重复值: 使用“数据”选项卡下的“删除重复项”功能,确保 数据的唯一性。 (2)处理缺失值: 识别空单元格,根据业务逻辑决定是填充(如用平均 值,上一行值),标记还是删除整条记录。 (3)统一数据格式: 使用“分列”或TEXT,DATEVALUE等函数,将不一 致的日期,数字文本等转换为标准格式。 (4)修正错误与不一致: 使用“查找和替换”修正拼写错误,统一命 名(如“北京”和“北京市”);使用TRIM,CLEAN函数清除多余空格和不 可见字符。 (5)拆分或合并列: 使用“分列”功能将复合信息(如“姓名,部门”) 拆分开,或使用&符号和CONCATENATE 函数合并多列信息。 21. 请解释单元格引用中的“相对引用”,“绝对引用”和“混合引用”有何不 同,并各举一个公式示例说明其适用场景。 (1)相对引用(如 A1): 特点: 公式复制时,引用地址会相对变化。 示例: =SUM(B2:B10),向下复制到下一行会变为=SUM(B3:B11)。 适用场景: 对每一行/列进行相同结构的计算(如计算每位员工的月度合 计)。 (2)绝对引用(如$A$1): 特点: 公式复制时,引用地址固定不变。 示例: =C2*$F$1(假设F1是固定税率),复制公式时,C2会变,但F1始终不 变。 适用场景: 引用某个固定的常量或基准值(如税率,汇率,目标值)。 (3)混合引用(如$A1 或 A$1): 特点: 公式复制时,行或列其中之一固定。 示例:制作乘法口诀表时,公式=$A2*B$1,向右复制时列标B会变,但行号1 固定;向下复制时行号2会变,但列标A固定。 适用场景: 需要固定行或列其中一方的计算(如交叉表计算,矩阵分析)。 第 128 页 共 140 页 22. 在制作用于向管理层汇报的数据表格仪表板或报告时,关于图表和表格的美 化,应遵循哪些核心原则? (1)简洁清晰,消除杂乱: 去除不必要的背景,网格线,三维效果等装 饰性元素,让数据本身成为焦点。 (2)强化重点,引导视线: 使用颜色,数据标签,注释等方式突出关键 数据,结论或未达标的项目。 (3)保持一致性和专业性: 整个报告使用统一的配色方案,字体和图 表风格,营造专业,可信的印象。 (4)标题和标签明确: 每个图表都应有能概括其核心信息的标题,坐标 轴,数据系列应有清晰无误的标签。 (5)为阅读场景优化: 考虑报告是用于屏幕演示还是打印,调整字体大 小,颜色对比度,确保在任何媒介上都易于阅读。 23. 请描述使用“切片器”与“日程表”对数据透视表进行筛选的异同点。 (1)相同点: 两者都是可视化,交互式的筛选工具,能清晰地展示当前 筛选状态,并且可以同时关联并控制多个数据透视表或图表。 (2)不同点: 1适用字段: 切片器适用于任何类型的字段(文本,数字,日期); 日程表专门用于日期字段。 2筛选方式: 切片器为每个唯一的项目提供一个按钮,通过点击按 钮进行筛选;日程表提供一个时间轴滑块,用户可以按年,季度,月,日等 时间粒度动态地选择一段时间范围进行筛选。 3适用场景: 切片器适用于任意维度的精准筛选;日程表特别适合 时间序列分析,操作更直观高效。 24. 在数据分析中,“分类汇总”功能与“数据透视表”功能都能对数据进行分 组统计。请简述它们的主要区别。 (1) 操作与灵活性: 分类汇总: 操作相对简单,但一次性。直接在原数据区域插入汇总行,会改 变数据结构;要按不同字段汇总或调整视图,需要先删除原有汇总,重新设置。 数据透视表:在新的区域生成交互式报表,不改变源数据;用户可以通过拖 拽字段,动态,灵活地切换行,列,值和筛选器,从任意角度进行多维分析,且可 随时刷新。 (2)输出结果: 第 129 页 共 140 页 分类汇总: 汇总结果与明细数据混合在一起,查看不够清晰。 数据透视表:结果是独立的,结构清晰的汇总表,支持折叠/展开明细,便于 查看不同层级的数据。 (3)适用场景: 分类汇总: 适用于简单的,一次性的单维度或双维度汇总(如按部门汇总 员工薪资)。 数据透视表:适用于复杂的,多维度的,需要反复调整分析角度的场景(如 同时按地区,产品,时间汇总销售额)。 25. 假设你有一张员工考核成绩表,需要完成以下任务:①删除任何一门成绩低 于60分的员工记录;②按工号升序排列;③计算每位员工的总分和平均分(平均 分保留2位小数);④根据总分进行绩效排名(最高为第1名);⑤为排名前两名 的员工核算奖金(第一名1500,第二名800)。请列出完成这些任务可能需要用到 的数据表格核心功能或函数。 (1)数据清洗:使用“数据”选项卡下的“筛选”功能找出不及格记录, 或使用“排序”功能定位后删除行。 (2)数据排序: 使用“数据”选项卡下的“排序”功能,按“工号”字 段升序排列。 (3)计算总分与平均分:使用SUM函数计算总分(如=SUM(B2:D2)); 使用AVERAGE 函数计算平均分(如=AVERAGE(B2:D2));通过“设置单元 格格式”将平均分的小数位数设置为2位。 (4)绩效排名: 使用RANK.EQ 函数(如=RANK.EQ(F2, $F$2:$F$N, 0)), 其中F列为总分,0表示降序排名。 (5)核算奖金:使用IF函数进行逻辑判断(如=IF(G2=1,1500,IF(G2=2, 800, '-'))),其中 G 列为排名;可使用自定义单元格格式为奖金金额添 加货币符号和千位分隔符。 26. 请论述大模型在生成内容时可能产生的“幻觉”(Hallucination)问题。 在设计问答系统时,有哪些技术手段可以识别或减轻幻觉? (1)定义: 指大模型生成与事实不符、无中生有或与上下文矛盾的内 容 。 (2)减轻手段: 1 RAG(检索增强生成): 让模型基于检索到的外部知识库生成答 案,而非仅依赖内部参数化记忆,是缓解幻觉最有效的方法。 第 130 页 共 140 页 知识提示: 在提示词中明确提供准确的相关背景信息。 2 3校准模型自信度: 引导模型在不确定时表达“不确定”或“需要 更多信息”。 4事实一致性检查: 使用额外的模型(如NLI模型)对生成的答案 与检索到的证据进行一致性评分。 27. 请论述在大模型时代,“数据标注”这一环节正在发生怎样的变革?对标注 人员的技能提出了哪些新要求? (1)变革: 从传统监督学习的“大规模、重复性、简单分类”标注, 向大模型时代的“高质量、精细化、复杂任务”标注转变。 (2)指令微调数据: 需要标注人员撰写高质量的“指令-回答”对,要 求回答不仅准确,还要符合人类偏好(有用、诚实、无害)。 (3)RLHF 数据: 需要对模型生成的多个答案进行排序,评估其优劣, 这要求标注人员有更精细的审美和判断力 。 (4)多模态数据: 需要对齐图像、视频、文本等多种模态的信息,标 注任务更复杂 。 (5)新技能要求: 标注人员不仅需要懂数据,还需具备更强的领域知 识(如法律、医疗)、内容创作能力和逻辑推理能力,能评估模型输出的 质量和安全性。 28. 智能体的“记忆”模块通常分为短期记忆和长期记忆。请论述这两种记忆在 智能体工作流程中的作用,以及它们可能的技术实现方式。 (1)短期记忆: 作用是在当前对话会话或任务执行过程中,记录上下 文信息和中间步骤,用于保持对话连贯性和任务状态。技术实现通常是在 Prompt 的上下文中包含历史交互摘要或日志。 (2)长期记忆: 作用是将用户偏好、关键事实、跨会话的知识存储下 来,以便在未来的交互中提供个性化服务。技术实现通常是将信息存入向 量数据库,当需要时通过检索(RAG)的方式将相关记忆加载到短期记忆中。 29. 什么是“对抗性提示”?并论述开发者应如何防御这类攻击。 (1)定义: 精心构造提示词,试图诱导大模型绕过其内置的安全和对 齐机制,生成有害、违法或不道德的内容。 (2)防御措施: 1输入过滤:检测并拦截包含已知越狱模式的输入。 第 131 页 共 140 页 2对抗训练:在训练/微调阶段,使用红队测试生成的对抗样本进行训练, 使模型学会抵制此类诱导 。 3输出审核:对模型生成的内容进行二次审核,一旦发现不安全内容就 进行拦截或替换。 30. 什么是智能体(Agent)?请描述一个由大模型驱动的智能体的典型工作流 程(感知-规划-行动-记忆)。 (1)定义: 智能体是一种能够感知环境、进行决策并执行动作的实体。 在大模型时代,智能体以大模型为核心大脑 。 (2)典型工作流程: 1感知:接收来自外部环境的信息(如用户指令、传感器数据、API返 回结果)。 2规划:大模型对任务进行拆解,制定执行计划(如ReAct框架,思考 下一步行动)。 3行动:调用外部工具(如搜索引擎、计算器、代码解释器、数据库) 执行计划中的步骤。 4记忆:将历史交互信息和执行结果存储在记忆模块中,用于后续的规 划和决策。 31. 结合电力行业特点,论述在构建企业级数据中台时,应如何设计数据质量管 理体系?请具体说明针对电网运行、营销服务等核心业务数据,可能面临的质量 问题及治理措施。 结合电力行业特点,企业级数据中台的数据质量管理体系应遵循“全程管 控、闭环治理、业务驱动”原则,从组织、制度、技术、流程四方面构建。 (1)在组织上,成立数据治理委员会,明确生技、营销等部门为数据责 任主体,中台设专职数据质量团队。制度上,制定覆盖数据全生命周期的 质量标准和检核规则,将质量纳入绩效考核。技术上,依托中台建立统一 的数据质量平台,实现质量规则配置、稽核执行、问题监控与整改跟踪的 自动化闭环。流程上,形成“问题发现—分析—派单—整改—验证—考核” 的闭环机制。 (2)针对电网运行业务数据,常见质量问题包括:设备台账与实时采集 数据不一致,如型号、参数缺失或错误;遥测遥信数据在传输中产生丢包、 时延或误码,导致状态估计不准;模型版本更新不及时,造成“图模不一 致”。治理措施:建立设备资产“源端唯一”的主数据管理,实现PMS、EMS 第 132 页 共 140 页 等系统数据强关联校验;部署边缘数据清洗节点,对实时数据进行异常值 检测与补录;建立电网模型版本管理机制,利用拓扑校验自动发现并提醒 图模差异。 (3)针对营销服务业务数据,常见质量问题有:用户档案信息不完整或 与用采系统不匹配,如户名、地址、联系方式错误;电费账务数据存在差 异,影响核算准确性;多源系统客户交互数据标准不一,导致客户视图分 裂。治理措施:构建以“用户—账户—计量点”为核心的主数据模型,通过 数据匹配与清洗实现跨系统档案一致性校验;在电费计算环节设立事前规 则校验、事后异常监控的双重防线,对异常数据自动阻断并触发工单核实; 建立客户统一视图,利用数据质量平台对多源服务数据的时效性、一致性 进行周期性稽核,确保客户画像准确。 (4)通过上述体系设计与针对性治理,可保障电力数据中台“接得全、 管得住、用得好”,有效支撑精准调度、智能运维、业财融合及客户服务 等核心业务。 32. 在电力设备状态监测场景中,如何利用时序数据分析方法(如趋势分析、异 常检测)实现变压器、断路器等关键设备的故障预警?请描述分析流程、关键技 术选型及结果应用路径。 在电力设备状态监测中,利用时序数据分析实现故障预警的流程如下:首先 进行数据采集,通过传感器获取变压器油温、绕组电流、振动,断路器分合闸线 圈电流、机械行程等时序数据,经清洗、对齐、降噪后构建统一时序数据库。关 键技术选型方面,趋势分析采用移动平均、指数平滑或STL分解提取长期变化规 律,结合线性回归或ARIMA模型判断特征量是否偏离正常演化路径;异常检测则 利用孤立森林、LSTM自编码器或动态时间规整捕捉突发性离群点,并设置自适 应阈值减少误报。分析流程将上述方法串联:先对多源时序数据进行特征工程提 取健康指标,再通过滑动窗口实时计算趋势偏离度与异常得分,当两者超过预设 门限且持续一定时间后触发预警。结果应用路径上,预警信息经置信度分级后推 送至运维平台,低级预警用于生成例行检修建议,高级预警结合设备台账与历史 案例自动定位可能故障模式,并指导差异化巡检或临时停运决策,最终将反馈结 果闭环至算法模型进行持续优化。 33. 假设你需要为“短期电力负荷预测”模型构建训练数据集,请阐述数据来源 (如SCADA、用电信息采集系统)、特征工程方法(如天气、节假日特征构造), 以及如何保证数据的时效性与代表性。 第 133 页 共 140 页 数据来源方面,主要来自SCADA系统采集的电网实时运行数据,包括电压、 电流、有功功率等;用电信息采集系统提供的用户侧历史负荷数据;气象部门或 第三方天气API获取的温度、湿度、风力、降雨等天气数据;以及日历数据,用 于标记工作日、周末、节假日。 特征工程上,构造时间特征如小时、星期几、是否为节假日;天气特征包括 当日及前几日的温度、体感温度、湿度等统计值;负荷的滞后特征,如前1天、 前7天同一时刻的负荷值;还可加入滚动统计特征如过去24小时负荷均值、峰 值。 保证时效性需建立自动化数据管道,确保模型每日或每小时内获取最新数据 并完成重训练或增量学习。代表性则通过选取覆盖全年四季、包含不同天气类型 和节假日的长时间连续数据,并采用交叉验证或时间序列划分来验证模型在不同 时段的表现,避免训练数据与业务场景分布偏移。 34. 电力行业在推进“数字孪生电网”建设过程中,需制定哪些关键的数据与模型 交互标准?请从数据格式、通信协议、模型接口等方面,论述标准规范对跨系统 协同的重要性。 数据格式方面需统一采用如CIM等国际标准,定义设备、拓扑、量测等对象 的语义与结构,确保不同系统间数据语义一致。通信协议应规范使用MQTT、Kafka 等消息中间件,并明确数据交互的时序、频率、质量标签与安全加密机制,保障 实时性与可靠性。模型接口需制定标准化的API或模型封装规范,明确输入输出、 版本管理、调用权限,实现物理实体与数字孪生模型的双向同步。 标准规范对跨系统协同至关重要:它能消除数据孤岛,使规划、运维、营销 等多系统在统一的语义与接口下无缝对接;确保孪生模型的准确映射与实时更 新;降低集成复杂度,提升系统扩展性与互操作性;并为数据安全与模型治理提 供统一管控基础,支撑电网全环节的协同优化与智能决策。 35. 请论述人工智能技术在电力巡检(如无人机巡检、图像识别)中的应用现状 与挑战,并分析如何通过优化算法模型与边缘计算部署,提升缺陷识别的准确性 与实时性。 应用现状方面,人工智能已广泛用于无人机巡检,通过计算机视觉中的目标 检测、图像分割等算法,自动识别绝缘子破损、鸟巢、导线异物、金具锈蚀等缺 陷,大幅替代人工判图,提升巡检效率。 挑战主要包括:缺陷样本稀缺且类别不均衡,导致模型对罕见缺陷漏检率高; 复杂背景、光照变化造成误检;海量图像回传云端处理实时性差,难以满足紧急 第 134 页 共 140 页 缺陷的快速响应;模型泛化能力有限,在不同线路、地形条件下表现不稳定。 提升准确性与实时性,可通过优化算法模型,采用小样本学习、数据增强、生成 对抗网络扩充缺陷样本,结合自注意力机制提升对微小缺陷的敏感度,并利用模 型压缩、知识蒸馏降低计算量。在边缘计算部署上,将轻量化模型直接搭载于无 人机或巡检终端,实现前端实时检测与告警,仅回传可疑图像或结果,减少传输 延迟与云端负载,同时结合边缘节点持续更新模型,从而兼顾识别精度与响应速 度。 36. 针对电力客服场景,如何利用行业大模型构建智能问答系统?请说明在训练 语料准备、领域知识注入、幻觉抑制等方面的具体设计思路,并讨论其与传统规 则引擎的融合策略。 针对电力客服场景,利用行业大模型构建智能问答系统的具体设计思路如 下: 在训练语料准备方面,需收集电力业务相关的工单记录、政策文件、操作手 册及历史对话,经脱敏后构建高质量数据集。重点标注意图分类、实体信息如户 号、电费、报修等和标准问答对,并采用数据增强技术丰富低频场景。 领域知识注入采用多阶段策略:首先在预训练或微调阶段融入电力专业文 本;其次通过外挂知识库,将电价政策、电网架构等结构化知识以向量数据库形 式存储,供模型检索增强;最后对关键业务设置规则约束,确保输出符合电力行 业规范。 幻觉抑制方面,结合检索增强生成,优先从可信知识库中获取依据再生成答 案;对模型输出进行事实核查,与业务系统数据交叉验证;引入强化学习机制, 基于人工反馈优化模型对不确定问题的拒答能力,减少编造。 与传统规则引擎的融合采用分层架构:简单高频问题如余额查询、停电范围 由规则引擎快速响应;复杂推理或多轮交互问题交由大模型处理。两者通过路由 层协同,规则引擎结果可作为大模型提示的上下文,大模型输出也需经规则引擎 校验合规性,实现优势互补,提升系统整体准确性与可控性。 37. 在电网调度系统中引入AI辅助决策模型时,可能面临哪些安全风险(如数 据投毒、对抗攻击)?请从模型训练、部署、运维全生命周期,提出针对性的防 御方案。 在电网调度系统中引入AI辅助决策模型,全生命周期面临的安全风险及防 御方案如下: (1)模型训练阶段 第 135 页 共 140 页 风险:数据投毒,攻击者注入恶意数据污染训练集,导致模型产生隐蔽性错 误决策;数据泄露,训练数据含敏感电网拓扑或运行信息。 防御:采用数据来源认证与完整性校验,严格筛选训练数据;运用差分隐私 或联邦学习,降低数据集中存储风险;对训练过程进行异常检测,发现数据分布 偏移时及时中断。 (2)模型部署阶段 风险:对抗攻击,通过对输入量测值添加微小扰动,使模型误判系统状态或 给出危险调度指令;后门攻击,攻击者利用训练阶段植入的触发器,在特定条件 下触发错误输出。 防御:部署前进行对抗性鲁棒性测试,使用对抗训练增强模型韧性;对输入 量测进行一致性校验,结合物理模型(如潮流方程)过滤异常输入;采用模型加 密与完整性验证,防止部署时被篡改。 (3)模型运维阶段 风险:模型漂移,电网运行模式变化导致决策精度下降,造成误判;恶意反 馈污染,攻击者操纵人工反馈或评估指标,使模型持续退化;输出滥用,调度员 盲目信任AI决策而忽略人工复核。 防御:建立持续监控机制,实时对比AI建议与物理约束、调度员经验,检 测决策偏差;定期使用离线测试集重新评估,必要时触发在线学习或版本回滚; 强化人机协同,设置AI置信度阈值,低置信度时强制人工介入;对模型更新进 行严格审计,防范反馈通道被污染。 整体上,需构建覆盖全生命周期的纵深防御体系,将安全检测、物理约束验 证、人工监督相结合,确保AI辅助决策在电网调度中的可控与可靠。 38. 针对“新能源场站功率预测”任务,请对比分析传统统计模型(如ARIMA)、 机器学习模型(如LightGBM)与深度学习模型(如LSTM)的适用性,并说明在 选型时需综合考虑的要素(如数据量、计算资源、可解释性)。 传统统计模型如ARIMA适用于数据量小、平稳性强的场景,建模简单、可解 释性好,但难以处理非线性、多变量和天气强相关的新能源功率序列,对非平稳 和突变适应性差。 机器学习模型如LightGBM擅长处理多特征(如气象、时间)、非线性关系, 训练快、精度较高,对中等数据量友好,可解释性中等,但在长期时序依赖上不 如深度模型,需人工特征工程。 深度学习模型如LSTM能自动捕捉长期时序依赖和非线性模式,适合大数据 量、多源输入场景,精度潜力高,但计算资源消耗大、可解释性弱,需大量调参 第 136 页 共 140 页 和训练数据。 选型时需综合考虑:数据量(小样本选ARIMA或轻量ML,大规模选LSTM)、 计算资源(资源有限选ARIMA或LightGBM)、可解释性要求(需解释选ARIMA 或LightGBM)、特征丰富度(多气象特征选ML或LSTM)、时序依赖性(强依赖 选LSTM)、预测时效(实时性要求高选LightGBM)以及业务精度需求。 39. 设计一个用于“窃电识别”的分类模型时,除准确率外,应重点关注哪些评 估指标(如精确率、召回率、F1-score)?请结合电力营销业务中样本不均衡、 误判成本高等特点,说明选择依据及阈值调整方法。 除准确率外,应重点关注精确率、召回率、F1-score,以及AUC-ROC和混淆 矩阵。 在电力营销业务中,窃电样本远少于正常用户,样本高度不均衡。若仅看准 确率,模型可能将全部用户判为正常而仍获高值,失去识别意义。此时召回率(真 正例率)尤为关键,它反映模型能找出多少实际窃电用户,漏判(假阴性)会导 致电费流失,损失直接且难以追回。精确率则衡量判为窃电的用户中实际窃电的 比例,误判(假阳性)会引发正常用户被稽查,造成人力浪费和客户不满。因此 需在召回率与精确率间权衡,F1-score作为调和平均数,是两者平衡的综合指 标。此外,AUC-ROC能评估模型在不同阈值下的整体排序能力,不受固定阈值影 响。 基于误判成本高,应优先确保召回率满足业务底线,再提升精确率。阈值调 整方法:通过验证集绘制精确率-召回率曲线,根据业务容忍度选择阈值。例如, 若漏检成本远高于误检,则降低阈值(如从0.5降至0.3)以提升召回率,宁可 多查也要少漏;若稽查资源有限、需提高效率,则提高阈值以提升精确率。实际 中常结合成本矩阵,将误判代价代入模型,选择使总成本最小化的阈值。 40. 假设你负责推进“基于AI的设备故障抢修优化”项目,请论述从数据治理、 模型构建到业务落地的全流程关键步骤,并分析在基层单位推广时可能遇到的阻 力及应对策略。 该项目全流程关键步骤如下: (1)数据治理阶段,首先明确配网拓扑、历史故障、抢修记录、气象、 设备台账等数据源,建立统一数据标准,重点解决多系统数据贯通、异常 数据清洗、时空对齐及敏感信息脱敏,确保数据质量与安全性。 (2)模型构建阶段,基于治理后的数据,构建故障精准定位、抢修资源 最优调度、预计复电时间预测等核心模型。采用图神经网络处理配网拓扑, 第 137 页 共 140 页 结合强化学习优化资源调度,并通过持续迭代训练提升模型准确率与可解 释性,同时建立模型评估与闭环反馈机制。 (3)业务落地阶段,将模型封装为微服务,嵌入现有调度、抢修指挥系 统,设计简洁实用的操作界面。通过试点验证优化流程,完善与抢修班组、 客服的协同机制,最终形成标准化作业指导书并规模化推广。 (4)在基层单位推广时可能遇到的阻力及应对策略:一是基层人员对新 工具的抵触心理,需通过深度参与设计、突出减负实效、树立标杆并开展 沉浸式培训来化解。二是数据质量与系统互通不足,应设立数据治理专班, 在推广前完成历史数据治理,并采用轻量级接口对接,降低对原有系统的 改造依赖。三是模型结果与实际经验存在偏差,需设置人工复核与干预接 口,建立一线专家反馈的持续优化闭环,提升信任度。四是基层单位硬件 条件与网络环境差异,需提供离线版或轻量化部署方案,并给予专项运维 支持。五是考核机制不匹配,应同步调整抢修时效、用户满意度等指标, 将系统应用成效纳入绩效,形成正向激励。 41. 请简述人工智能、机器学习与深度学习三者之间的区别与联系。 人工智能是一个广义概念,指让机器模拟、延伸和扩展人类智能的理论与技 术。机器学习是实现人工智能的一种方法,它通过从数据中学习规律和模式,使 计算机能够在没有明确编程的情况下完成特定任务。深度学习是机器学习的一个 分支,它基于多层神经网络,能够自动学习数据中的复杂特征表示,尤其擅长处 理图像、语音和文本等非结构化数据。三者的关系是:人工智能包含机器学习, 机器学习包含深度学习。 42. 请解释什么是过拟合和欠拟合,并分别说明如何缓解这两种问题。 过拟合是指模型在训练数据上表现很好,但泛化能力差,在测试数据上表现 不佳,通常因为模型过于复杂。缓解方法包括:增加训练数据、正则化、Dropout、 早停等。欠拟合是指模型在训练数据和测试数据上表现都不好,通常因为模型过 于简单。缓解方法包括:增加模型复杂度、增加特征、减少正则化等。 43. 请阐述Transformer模型中自注意力机制的核心思想及其优势。 自注意力机制的核心思想是:对于输入序列中的每个元素,通过计算它与序 列中所有其他元素的关联程度,来动态地聚合信息,从而捕捉长距离依赖关系。 其优势在于:能够并行计算,显著提升训练效率;能有效处理长序列,克服了 RNN 的梯度消失问题;通过多头机制,可以从不同角度捕捉丰富的语义信息。 第 138 页 共 140 页 44. 在模型选型时,除了准确率,还应考虑哪些关键因素?请至少列举三点。 除了准确率,模型选型还应考虑:1. 推理速度与延迟:对于实时应用,模 型必须能在可接受的时间内给出结果。2. 计算资源与成本:包括训练和部署模 型所需的硬件(如GPU)和能耗成本。3. 模型大小与部署环境:模型是否能适 配目标设备(如移动端、边缘设备)的存储和内存限制。4. 可解释性:在金融、 医疗等高风险领域,理解模型的决策依据至关重要。 45. 请解释什么是模型的可解释性,并说明其在实际应用中的重要性。 模型的可解释性是指人类能够理解和解释模型做出特定预测或决策的原因 和逻辑。其重要性体现在:1. 建立信任:让用户(尤其是非技术人员)理解并 信任模型的输出。2. 调试与优化:帮助开发者发现模型中的偏见、错误或逻辑 缺陷。3. 合规与伦理:在金融、医疗等受监管行业,可解释性是满足法律法规 和伦理要求的必要条件。4. 辅助决策:为人类决策者提供依据,实现人机协同。 46. 人工智能系统在应用中可能面临哪些主要的安全风险?请简述两种攻击方 式。 主要安全风险包括数据投毒、对抗样本攻击、模型窃取、后门攻击等。1. 对 抗样本攻击:通过在输入数据(如图像)中添加人眼难以察觉的微小扰动,就能 导致模型做出完全错误的预测。2. 数据投毒攻击:攻击者在模型的训练数据中 注入恶意样本,从而在模型训练完成后,使其在特定情况下表现异常或失效。 47. 请论述数据质量对人工智能模型性能的影响。 数据质量是决定人工智能模型性能的上限。低质量的数据会直接导致模型性 能下降,具体表现为:准确性差:数据中的错误、噪声或不一致会误导模型学习, 使其无法捕捉到真实的规律;泛化能力弱:如果训练数据不能充分代表真实世界 的数据分布,模型在面对新数据时表现会很差;引入偏见:如果训练数据本身存 在偏见(如样本不平衡),模型会学习并放大这种偏见,导致不公平的决策。 48. 请解释什么是提示词工程,并列举至少三种提升大模型回答质量的提示词技 巧。 提示词工程是通过设计和优化输入给大模型的文本指令,来引导模型生成更 高质量、更符合预期输出的技术。提升技巧包括:提供明确具体的指令:清晰定 义任务目标、输出格式和约束条件。少样本提示:在提示词中提供少量输入-输 第 139 页 共 140 页 出示例,帮助模型快速理解任务模式。思维链提示:引导模型在给出最终答案前, 先展示其推理步骤,提升复杂问题的解决能力。 49. 什么是模型蒸馏?请说明其在模型部署中的主要应用场景。 模型蒸馏是一种模型压缩技术,其核心思想是:利用一个复杂、高性能的“教 师模型”来指导一个轻量级的“学生模型”进行训练,使学生模型能够模仿教师 模型的输出行为或中间特征。主要应用场景是:在资源受限的环境部署AI应用。 通过蒸馏,可以将大模型的知识迁移到小模型中,在保持较高性能的同时,显著 降低模型的计算开销和存储需求,提升推理速度。 50. 在构建人工智能应用时,为什么需要进行持续监控和维护?请列举至少两个 原因。 人工智能模型并非一劳永逸,需要持续监控和维护,主要原因包括:数据漂 移:现实世界的数据分布会随时间变化,导致模型基于旧数据学习到的规律不再 适用,性能逐渐下降。概念漂移:输入数据与目标变量之间的关系可能发生改变, 例如用户行为模式变化,使得原有的模型预测失效。持续监控能及时发现这些问 题,并通过重新训练或调整模型来维持其有效性。 第 140 页 共 140 页