用户:Cewbot
外观
| Cewbot | |
|---|---|
| (讨论 · 贡献) | |
| 操作者 | kanashimi |
| 设计者 | kanashimi |
| 是否已批准? | Yes |
| 机器人权限? | 是 |
| 任务 | 见作业列表 |
| 编辑频率 | 平均每分钟12次 |
| 编辑时段 | 定期/常时持续 |
| 自动/手动 | 全自动编辑 |
| 编程语言 | JavaScript |
| 遵守机器人规范? | 是 |
| 源代码公开? | GitHub上的wikibot页面。 另见各作业说明 |
| 可以紧急停止? | 是 |
| Cewbot的用户框 |
| 此为机器人账号,使用wikiapi,操作者为kanashimi(讨论),属合规附属账户,以半自动或全自动方式协助用户处理繁琐而重复的工作。此机器人已得到许可,亦正在运作中。申请存档见此 管理员︰若然此机器人失灵或作出有问题编辑,请施予封禁。 |
| 按下作业列表之“停止”连结可停止个别作业。机器人会在当前批次处理完成后停止,通常是两三百个页面。 按左方封禁钮将封锁此账号,并停止所有作业。 |
| 欢迎提供各种特殊情况以作测试,并请协助检查错误。 若对我输出的任何文本内容有改进建议,请前往讨论页提出修改意见。 |
| 此机器人在Wikimedia Toolforge上运行,工具账户名为cewbot。 致管理员:如果这个机器人因程序故障需要封禁,封禁时请禁用自动封禁以免影响其他在Toolforge上运行的机器人。 |
机器人设计理念
[编辑]以下列出理想之机器人设计理念:
- 最小化更动
- 若是完全不更动也能接受,就不更动。若必须更动,则在可确认的范围内一次更改到位,包括规范化;否则仅作最小修正。
- 除非是非修正不可的问题,否则应该尽量避免修改封存纪录。
- 一次到位
- 更动具稳定度。同样操作执行一次后,第二次执行就不该有更动。
- 仅更动筛选过的内容
- 仅处理确认属于本次任务之 pattern。对于无法解析或有问题者,跳过不处理之。宁可漏判 (false negative) 也不误判 (false positive)。例如先对内容作尽可能精准之模式匹配,并针对符合之部分方作更动。若模糊无法判别,则不更动,而注记为可能需要增加模式、或需要人工判别之内容。
- cf. 最小权限原则
- 考量特殊wikitext
- 处理页面最好采用语法解析器。直接处理wikitext时,须考量特殊情形。如:
- 考量相同表现之语法。如:要寻找所有“軟體”亦须匹配字词转换语法「軟-{}-體」。
- 要侦测所有{{Tl}}须排除“
<!-- {{Template:Tl}} -->”或在<nowiki></nowiki>中的情况。 - 使用
{{-}}、{{!}}、{{=}}、解析器函数、特殊字符与魔术字的情况。例如要找“机器人”,也得考虑“{{{name|{{int:Group-bot}}}}}”。
因此:
- 依据规范产生wikitext,少用花俏(漂亮舒适而繁杂)但能产生(解析出)相同表现之语法。
- 对大量使用之外部链接,以模板替代之。e.g., 近代デジタルライブラリーのアドレス変更およびテンプートによるカプセル化
- 繁简文字直接用分歧性最大的语言,于分歧性小的语言自动转换就没有这个烦恼了。就“-{回复}-”、“-{回復}-”、“-{回覆}-”来说,使用繁体,简体自动转换。遇到“著”这个这个字则分开成“着”和“著”(
由于“著”字意思太多,香港和大陆将“着”、“著”二字分家,其实比台湾只用一字更能消除歧义。
)。这样都能显著降低转换错误的困扰。(Wikipedia:互助客栈/其他#假如有很简洁扼要的方法能解决繁简转换问题,是否有必要特地使用复杂的手工转换标签?有相关讨论) - 字词转换应该尽可能维持整个词汇的完整,这样除了人类容易读源代码,亦可方便机器处理。若无必要,建议采用「-{軟體}-」而非「軟-{}-體」以方便搜寻。必要时,亦可考虑以零宽空格代替<nowiki>。
- 完整记录
- 尽可能作完整记录。可能的话还包含 undo script。
- 更动后须测试再上路
- 每次更动后皆先作小幅度测试。若发生问题则即时回复,确保没问题再正式上路,应用于成品/上线环境 (production environment)。
- 考量人类作业的因素
- 机器人的操作应该能够让人类理解。并且若是人类手动代替机器人操作部分作业时,机器人也能够正确判别以及运作。
- 机器人对使用者编辑的修正应采用友善的语气。
- 当机器人失灵时,人类应当有办法手动代替作业。例如不能够把知道某些密码、密钥或是杂凑值或者其生成方法当作编辑后能够正确运作的条件。
- 机器人应考虑作业到一半被其他人或者其他机器人插断、编辑冲突的情况,若可行则再次作业,或采行相对应的措施。
- 开放源代码并且维持一个能够即时修改维护程式的团队
- 这可以让机器人在出问题、有漏洞时可以即时更正,并且避免机器人年久失修、无人维护。
Cewbot 作业列表
[编辑]| # | 作业用途 |
状态 | 备注 |
|---|---|---|---|
| 1 | 替换台铁图徽为SVG版本 | 开始机器人作业请求 | |
| 2 | 添加规范控制模板 | ||
| 3 | 修正不适宜用词:相关词条 | ||
| 4 | 修正错别字:钱钟→钱锺 | ||
| 5 | 修正配音误用模板 | ||
| 6 | 提报关注度不足过期提醒 | ||
| 7 | 拆分或合并维护模板 {{Multiple issues}} | ||
| s:1 | 校订繁简转换,修正错别字 | @维基文库 | |
| 8 9 10 13 18 |
修复维基百科语法错误 (WP:WPCHECK), Special:LintErrors错误语法清理 |
||
| N/A | 记录页面之维护清理与归档封存作业 仅执行于使用者与bot页面 |
2016/3/23– @zhwiki 2016/6/9– @jawiki 只在拥有者用户空间编辑,依据方针毋需申请 | |
| d:1 | Import labels/aliases | @wikidata | |
| 11 | 使用Wikidata数据来清理跨语言链接 | 由机器人修复跨语言链接 | |
| ja:1 | 仮リンク整備 | @jawiki | |
| d:2 | Synchronize data | @wikidata | |
| ja:1-2 | Bot作業依頼 | @jawiki | |
| en:1 | Convert interlanguage link templates with local article to wikilinks | @enwiki, also help bot requests | |
| n:1 | 检查与维护外部链接 | @wikinews | |
| n:2 | 汇入每日报纸头条新闻标题 | @wikinews | |
| n:3 | 存档保护作业 | @wikinews | |
| n:4 | 自动定时清理沙盒 | @wikinews | |
| d:3 | Import data from 台湾物种名录 (Q26218155) to wikidata. | @wikidata, 台湾物种名录 | |
| 12 | 将跨语言链接模板转为内部链接(一般 wikilink) | 受影响页面 | |
| ja:2 | ウィキ文法のチェックと修正 | @jawiki | |
| moegirl 1 | 自动存档萌娘百科讨论版、提问求助区。自动定时清理沙盒。 | 清理沙盒由星海-adminbot代 自动存档: |
@萌娘百科 |
| c:1 | Add photo links on TAIBNET of species. | 因版权问题未批准 |
@commons |
| c:2 | Upload images from 慕光之城 蛾类世界. | 因版权问题未批准 |
@commons |
| c:3 | Upload pictures from Public Domain Pictures.net with tags. | 因版权问题未批准 |
@commons |
| 14 | fix LanguageConverter syntax | ||
| 15 | 帮忙补签名 | ||
| 大典:1 | 沙盒清理+帮忙补签名+语法校正 | @大典, approved | |
| n:5 | 半自动汇入美国之音的报导 | @wikinews 常时运行 | |
| n:6 | 帮忙补签名 | @wikinews | |
| n:7 | 更新讨论页面主题列表 | @wikinews | |
| n:8 | 定期封存讨论页面 | @wikinews | |
| 大典:2 | 更新讨论页面主题列表 | @大典 | |
| c:4 | Cleanup Panoramio files needing categories | @commons, also help bot requests | |
| 16 | 更新讨论页面主题列表 | ||
| ja:3 | 見やすい議題一覧表の作成 | @jawiki | |
| s:2 | 更新讨论页面主题列表+补签名+沙盒清理 | @维基文库 | |
| 17 | 自动定时清理沙盒 | ||
| c:5 | Import M 6+ USGS earthquake shakemaps and DYFI City Maps | @commons | |
| incubator:1 | 为闽东语维基新闻自动添加每日报章头条 | 以一般用户身份运行 @Wikimedia Incubator | |
| moegirl 2 | 帮忙补签名 | 由星海-adminbot代 |
@萌娘百科 |
| v:1 (+bot) | 更新讨论页面主题列表+补签名+沙盒清理 | @维基学院 | |
| 19 | 自动更新 zhwiki 首页特色内容、优良条目 | 除修正页面、更新列表外, 以一般用户身份运行 | |
| c:6 | Cleaning over-categorization 清理过度分类 | @commons running regularly | |
| c:7 | Automatically uploading hurricane track maps | @commons | |
| 20 | BOTREQ: 清理Category:公司信息框使用额外地区代码参数的页面 | ||
| c:8, + | Generate topic list for discussion pages | @commons | |
| 21 | 维护讨论页之存废讨论纪录与模板 {{Old vfd multi}} | ||
| 22 | 更新Wikipedia:数据库报告页面 | ||
| en:2 | Updating the section counts and article assessment icons for all levels of Wikipedia:Vital articles. |
@enwiki | |
| en:3 | Maintaining the template {{Vital article}} in the talk pages. | @enwiki | |
| en:4 | To inform of the article's PROD eligibility. | @enwiki | |
| moegirl 3 | 更新讨论页面主题列表 | @萌娘百科
测试程式码能否正常运作 | |
| en:5 | Normalizing {{Multiple issues}} | @enwiki | |
| 23 | 修正失效的章节标题 Fixing broken anchors | ||
| en:6 | 修正失效的章节标题 Fixing broken anchors | @enwiki | |
| ja:4 | 壊れたアンカーの修正 Fixing broken anchors | @jawiki | |
| simple:1 | fixing broken anchors, adding {{Unsigned}}, and {{Article issues}}. | @simplewiki | |
| moegirl 4 | 修正失效的章节标题 Fixing broken anchors | 由星海-adminbot代 |
@萌娘百科 |
| en:7 | Sorting category of Thai names | @enwiki | |
| 24 | 调整页面的字词转换规则 | ||
| 25 | 正规化日期格式、清理引文模组未知参数 | ||
| c:userland | Notify new files in category. | @commons userland | |
| en:8 | Maintaining challenge templates on corresponding pages. | @enwiki | |
| en:9 | Updating all levels of Wikipedia:Vital people. | @enwiki | |
| ja: | 诸言语版のFA及びGA、FLの更新 | @jawiki | |
| 26 | 强化 维基百科:其他语言的维基百科典范条目 | ||
| ks:1 | Normalizing {{Multiple issues}} | @kswiki | |
| wikt:1 | 目录列表、补签名、修正错误锚点之类 | @zhwiktionary 顺便处理机器人请求 | |
| en:10 | Create lists for w:en:Wikipedia:Featured articles in other languages and for GA, FL | @enwiki | |
| n:9 | 同步通用页面 | @wikinews | |
| wikt:2 | 自动存档机制+同步通用页面 | @zhwiktionary 顺便处理机器人请求 | |
| d:4 | Import new articles from online resources. | @wikidata | |
| b:1 | topic list、补签名、存档、修正错误锚点、清理沙盒之类 | @zh.wikibooks | |
| n:10 | 创建每日/每月新闻摘要页面+分类 | @wikinews | |
| en:11 | Generate topic list for discussion pages | @enwiki | |
| de:1 | Fixing broken anchors | @dewiki | |
| simple:2 | Convert interlanguage link templates with local article to wikilinks. | @simplewiki | |
| n:11 | 清理重定向的分类 | @wikinews | |
| 27 | 清理重定向的分类 | ||
| 28 | 清理导航模板的重导向内部链接,转换模板中的内部链接为目标页面标题。 | ||
| en:12 | Maintain {{WikiProject banner shell}} | @enwiki | |
| 29 | 维护 {{WikiProject banner shell}} | ||
| 30 | 修正拼写错误连结 | ||
| voy:1 | 更新讨论页面主题列表+定期存档+清理跨语言链接+补签名+修正错误锚点+沙盒清理 | @维基导游 |
申请中作业
[编辑]
正在处理...目前正审批(请求bot权限中)之作业
运行中作业
[编辑]TODO: w:en:Template:Log, w:en:Template:ToDo
提报关注度不足过期提醒
[编辑]- 利用
{{Notability-talk}}将提交到通用关注度分类下的、列入超过30天的页面的用户讨论页上留言,询问是否需要提删。 «停止»
- 若您不想接受关注度提醒,请利用
{{bots|optout=afd}}模板。或利用{{Personal announcement}}模板之类,在您的用户讨论页中加入如下列之提醒:“请勿在讨论页中放入关注度信息”。 - 长期性作业,将定期运行。编辑频率:每天一次。
- bot 运作记录: User:cewbot/log/20150503
- TODO:
{{bots|optout=np}} - 已批准。
拆分或合并维护模板
[编辑]- 长期性作业,将会定期运行或不定期手动执行。编辑频率:每月或每周一次。
- 设定参数: User:Cewbot/规范多个问题模板设定
- bot 运作记录: User:cewbot/log/20150916
- 已批准。
修复维基百科语法错误
[编辑]- 长期性作业,将会定期运行或不定期手动执行。编辑频率:每月或每周一次。
- bot 运作记录: User:cewbot/log/20151002
- 多项已批准。
将跨语言链接模板转为内部链接
[编辑]- 长期性作业,将会定期运行。编辑频率:每周一次。
- 已批准。
- GitHub上的源代码 (source code)
帮忙补签名
[编辑]- 帮忙补签名«停止»
- 长期性作业,将会持续运行。
- bot 运作记录: User:Cewbot/log/20170515
- 已批准。
- GitHub上的源代码 (source code)
- 您可于特定页面加入
{{Bots|optout=SIGN}}来避免机器人添加签名标记。 - 您可在您的用户页或您的用户讨论页加入
{{NoAutosign}}来避免机器人为您自动补签名。 - 若您只是暂存,请在编辑注解加上"暂存"字样即可避免补签名。若您希望自行手动补签名,请径行修改即可。
增加讨论页面主题列表
[编辑]- 增加讨论页面 topic list 主题列表«停止»
- 长期性作业,将会持续运行。
- 设定参数: User:Cewbot/讨论页面主题列表设定
- 已批准。
- GitHub上的源代码 (source code)
自动更新首页特色内容
[编辑]- 长期性作业,以一般用户身份运行。编辑频率:对于明天以及后天的特色内容与优良条目,每天2次。«停止»
- Wikipedia:首页/特色内容展示设定、Wikipedia:首页/特色内容展示报告、Wikipedia:首页/优良条目展示报告。
- GitHub上的源代码 (source code)
- 已批准。
清理Category:公司信息框使用额外地区代码参数的页面
[编辑]- 用途:BOTREQ:清理Category:公司信息框使用额外地区代码参数的页面
- GitHub上的源代码 (source code)
- 长期性作业,将会持续运行。
- 已批准。
Fix broken anchor
[编辑]- Configuration: User:Cewbot/log/20201008/configuration
- GitHub上的Source code
- The bot also notify broken anchors in the talk page via {{Broken anchors}}.
- 已批准。
- I don't want the bot to modify my archives!
- Please using
{{bots|optout=anchor-fixing}}, the bot will skip this page.
已完成或结束作业
[编辑]已结案:
完成、
已完成、停止作业(任务型),请协助检查错误。
添加规范控制模板
[编辑]- 转移 en wiki 之规范控制 (Authority control) 模板。
- bot 运作记录: User:cewbot/log/20150109
- Wikidata:WikiProject Authority control/Status
- 规范控制模板使用数目: 461277
- 已批准。
修正配音误用模板
[编辑]- 正规化角色介绍,修正配音误用
已解决{{Language icon}}。
- bot 运作记录: User:cewbot/log/20150227
- 已批准。
修正错别字:钱钟→钱锺
[编辑]
已修复 钱钟→钱锺
- bot 运作记录: User:cewbot/log/20150210
- 本例已批准。
替换台铁图徽为SVG版本
[编辑]- 将台铁图徽TRA_Logo.png替换为SVG版本File:TRA Logo.svg,以利后续将PNG版本删除。
- bot 运作记录: User:cewbot/log/20150103
- 已批准。
添加维基文库中提及本年的原始文献连结
[编辑]- 对前699年–1910年批量添加{{wikisource year mention}}
- GitHub上的源代码 (source code)
未批准作业
[编辑]
不合要求、
驳回、
搁置作业、
不可行、
不建议机器人处理(建议手动修改)、撤回请求
修正不适宜用词:相关词条
[编辑]相关词条→相关条目
bot 运作记录: User:cewbot/log/20150120没有必要。
撤回请求作业
已取消作业
机器人制作软件架构
[编辑]Cewbot 采用了包含制作机器人功能的 JavaScript 软件架构,可离线开发和运行。
- framework: wikiapi / CeJS MediaWiki 自动化作业用的程式库
- 可执行环境: node.js, JScript
- 采用 CeJS 函式库来制作维基百科机器人的范例
Screenshot when fixing WPCHECK
The User agent is CeJS/2.0 (https://github.com/kanasimi/CeJS)
when it's running under node.js.
API 功能使用状况
在 Wikimedia Toolforge 配置 node.js 任务的注意事项
[编辑]
- Wikimedia Toolforge 采用的是 node v0.10.25, npm 1.3.10。
- 检查好函式库路径。跑 crontab 或以 jsub 执行时,自行以 npm 安装的 package 可能无效。得不依赖工作目录才行。
- 把配置记忆体增大。node.js 会因为记忆体不够大而 crash。
- 可以直接在 command 下
/usr/bin/jsub -N cron-tools.cewbot-1 -mem 1g -once -quiet __work__测试。
- Wikimedia Toolforge 上之数据库仅为正式上线版之删节副本。资料并非最新版本(但误差多于数分内),也不完全。
- ref. mw:Toolserver:Servers IP: w:en:Wikipedia:Blocking IP addresses#Sensitive for other reasons (91.198.174.0/24, 185.15.56.0/22, 198.35.26.0/23, 208.80.152.0/22), mw:Toolserver:Admin:DNS, mw:Meza/Install on Wikimedia Cloud VPS instance (172.16.0.0/16)
机器人常用关联资料
[编辑]- Cewbot status
- 机器人编辑纪录 跨语言活动 Global user contributions
- 全域账号资讯 SUL
- Global latest edit XTools WikiChecker
- API feature usage 功能使用状况
- Sub pages 机器人所有子页面
- toolsadmin k8s-status
- toollabs:cewbot web page
| tool |
|---|
| cewbot |
| signature-checker |
| toc |
| anchor-corrector |
| (mgp-cewbot) @ zh.moegirl |
- 机器人 status
- 33个机器人清单, 使用者权限级别, 使用者群组权限一览
- 机器人操作列表 (bot activity by last edit)
- List of bots by editcount List of bots by editcount (wikidata) zh.wikiscan
- 维基百科数据 汉语
- Debian Stretch grid status, Project: Tools Wikimedia Toolforge Tools 对外出口IP 185.15.56.0/24 (ask from IRC, not wikitech:News/CloudVPS NAT wikis)
- 维基媒体集群负载/内存状态概述 wikidata edits
- Edit summary search
- Icons
- Boards
- Development information
- Test pages and sites
- Sandbox: 沙盒 模板测试沙盒 模板沙盒 Module测试沙盒 (Module:沙盒) API沙盒 Flow测试页面
- testwiki: test2wiki: testwikidata: zh Beta Cluster en Beta Cluster
- misc