MahjongGameDesigner

Sleeping

MahjongGameDesigner / output_validator.py

zhongchuyi

Initial deployment

20984d5 about 1 month ago

9.86 kB

	"""
	对模型输出做轻量静态校验（不依赖外部库）。

	目标：
	- 提前发现“缺少 mGDL / 缺少核心模块 / 输出里存在占位符”等高频失败
	- 为“最小修改修复”提供结构化的 FAIL 列表
	"""

	import re
	from typing import Dict, List, Optional, Tuple


	_FENCE_RE = re.compile(r"```(?:[a-zA-Z0-9_-]+)?\n(.*?)```", re.DOTALL)

	_CJK_GT = r"[>＞]"


	def _extract_mgdl_block(text: str) -> str:
	"""
	尝试从回答中提取最像 mGDL 的代码块（优先含 (game ... )）。
	"""
	if not text:
	return ""

	blocks = _FENCE_RE.findall(text)
	if not blocks:
	# 没有代码块时，退化为全文搜索
	return text if "(game " in text else ""

	best = ""
	for b in blocks:
	b_strip = (b or "").strip()
	if "(game " in b_strip:
	return b_strip
	if b_strip.startswith("(game ") or b_strip.startswith("(define_game"):
	best = b_strip
	return best


	def _has_any(text: str, needles: List[str]) -> bool:
	t = text or ""
	return any(n in t for n in needles)


	def _re_search(pattern: str, text: str) -> bool:
	return bool(re.search(pattern, text or "", flags=re.DOTALL))


	def validate_mahjong_response(text: str) -> List[Dict[str, str]]:
	issues: List[Dict[str, str]] = []
	if not text or not text.strip():
	return [{"code": "EMPTY", "level": "error", "message": "模型返回空内容"}]

	# 1) 占位符检查（m_prompt 强制禁止）
	if any(token in text for token in ["<PID>", "<NextPID>", "<Variant_Name>", "<custom>"]):
	issues.append({
	"code": "PLACEHOLDER",
	"level": "error",
	"message": "输出包含占位符（如 <PID>/<Variant_Name>），需展开为实际值（A1/A2/A3/A4 等）。"
	})

	mgdl = _extract_mgdl_block(text)
	if not mgdl:
	issues.append({
	"code": "NO_MGDL",
	"level": "error",
	"message": "未检测到 mGDL 代码块或 (game ...) 根节点。"
	})
	return issues

	# 0.5) 思维日志（设计日志）检查：生成模式下应包含“设计日志（创新推演摘要）”
	# Phase-1 聚焦“融合决策可审核”，避免停留在文本拼接。
	if "设计日志（创新推演摘要）" not in text:
	issues.append({
	"code": "NO_DESIGN_LOG",
	"level": "warning",
	"message": "未检测到“设计日志（创新推演摘要）”段落；Phase-1 建议补齐融合清单/冲突桥接/推演摘要/落地映射。"
	})

	# 0.6) 底层物理守恒表达检查（当前阶段重点）
	# 目标：强制模型在自然语言规则里显式给出“动作-手牌变化-轮次影响表”和“最小回合推演”
	if "动作—手牌变化—轮次影响表" not in text and "动作-手牌变化-轮次影响表" not in text:
	issues.append({
	"code": "NO_HAND_DELTA_TABLE",
	"level": "warning",
	"message": "未检测到《动作—手牌变化—轮次影响表》；该表用于避免“出牌后手牌不变”等守恒错误，建议补齐。"
	})
	if "最小回合推演" not in text:
	issues.append({
	"code": "NO_MIN_SIMULATION",
	"level": "warning",
	"message": "未检测到“最小回合推演”（普通/碰/杠三段）；建议补齐以验证手牌守恒与轮次控制。"
	})

	# 0.7) “硬真理”与机制说明对齐检查（以自然语言显式声明为主）
	# 说明：这里做的是“声明存在性”的静态校验（不是逻辑证明），用于减少模型忘写/乱写导致的回归。
	if not _re_search(r"(起手\|初始).13\s张", text):
	issues.append({
	"code": "NO_START_HAND_13",
	"level": "warning",
	"message": "未显式声明“标准起手 13 张”（麻将机制说明的基础逻辑）；建议在基础规则中补一句。"
	})
	if not _re_search(r"(摸\|抓).(14\s张)", text):
	issues.append({
	"code": "NO_DRAW_TO_14",
	"level": "warning",
	"message": "未显式声明“摸牌后手牌为 14 张”（基础逻辑）；建议补充以便审计守恒。"
	})
	if not _re_search(r"(打\|弃\|出).(回到\|恢复\|为).(13\s*张)", text):
	issues.append({
	"code": "NO_DISCARD_BACK_13",
	"level": "warning",
	"message": "未显式声明“打牌后手牌回到 13 张”（基础逻辑）；建议补充以便审计守恒。"
	})

	# 胡/碰/杠/吃优先级（允许不同符号表达）
	if not _re_search(rf"胡.{_CJK_GT}.碰.{_CJK_GT}.杠.{_CJK_GT}.吃", text):
	issues.append({
	"code": "NO_PRIORITY_ORDER",
	"level": "warning",
	"message": "未显式声明“胡＞碰＞杠＞吃”的响应优先级（基础逻辑）；建议补齐以避免争议场景。"
	})

	# 吃的限制
	if not _has_any(text, ["仅能吃上家", "只能吃上家", "只可吃上家"]):
	issues.append({
	"code": "NO_CHI_UPWIND_ONLY",
	"level": "warning",
	"message": "未显式声明“吃仅能吃上家牌”（基础逻辑）；建议补齐。"
	})

	# 行牌顺序与出牌权归属（声明存在性）
	if not _has_any(text, ["庄家-下家-对家-上家", "庄家→下家→对家→上家", "庄家 → 下家 → 对家 → 上家"]):
	issues.append({
	"code": "NO_TURN_ORDER_BASE",
	"level": "warning",
	"message": "未显式声明“庄家-下家-对家-上家”的行牌顺序（基础逻辑）；建议补齐。"
	})
	if not _has_any(text, ["由碰牌的玩家继续出牌", "由吃/碰者继续出牌", "碰后由碰者出牌"]):
	issues.append({
	"code": "NO_POST_PENG_RIGHTS",
	"level": "warning",
	"message": "未显式声明“碰/吃后由碰/吃者继续出牌”的出牌权规则（基础逻辑）；建议补齐。"
	})
	if not _has_any(text, ["由杠牌的玩家摸牌后继续出牌", "杠后由杠者补牌后继续出牌", "杠后由杠者继续出牌"]):
	issues.append({
	"code": "NO_POST_KONG_RIGHTS",
	"level": "warning",
	"message": "未显式声明“杠后由杠者补牌/摸牌后继续出牌”的出牌权规则（基础逻辑）；建议补齐。"
	})

	# 自摸/点炮触发方式
	if not (_has_any(text, ["自摸"]) and _has_any(text, ["点炮"])):
	issues.append({
	"code": "NO_ZIMO_DIANPAO",
	"level": "warning",
	"message": "未同时出现“自摸/点炮”两种胡牌触发方式（基础逻辑）；建议补齐。"
	})

	# 若引入改变摸打节奏的机制，建议额外最小推演（Prompt 已要求）
	special_rhythm_terms = ["连续摸", "摸三打三", "海底漫游", "海捞阶段", "海捞区"]
	if _has_any(text, special_rhythm_terms):
	if not _re_search(r"(最小回合推演).*(" + "\|".join(map(re.escape, special_rhythm_terms)) + ")", text):
	issues.append({
	"code": "NO_SPECIAL_MIN_SIM",
	"level": "warning",
	"message": "检测到改变摸打节奏的机制（如摸三打三/连续摸/海捞），但未看到对应机制的额外“最小回合推演”；建议补齐以验证守恒。"
	})

	# 2) 核心模块检查（按 m_prompt 的“零容忍项”）
	required_markers = [
	"(game_variant",
	"(players",
	"(tileset",
	"(extensions",
	"(seats",
	"(turn_order",
	"(setup",
	"(actions",
	"(win_rules",
	"(scoring",
	"(fan_table",
	"(settlement",
	"(invariants",
	]

	missing = [m for m in required_markers if m not in mgdl]
	if missing:
	issues.append({
	"code": "MISSING_MODULES",
	"level": "error",
	"message": "mGDL 缺少核心模块: {0}".format(", ".join(missing))
	})

	# 3) special_mechanics 注册点（你们工程关键）
	if "(special_mechanics" not in mgdl and "extensions.special_mechanics" in text:
	issues.append({
	"code": "SPECIAL_MECH_MISMATCH",
	"level": "warning",
	"message": "自然语言提到 special_mechanics，但 mGDL 中未出现 (special_mechanics ...) 或 extensions.special_mechanics 结构。"
	})

	# 4) 简单守恒提示：total 字段存在性（无法保证正确，但能抓掉一批缺失）
	if "(total" not in mgdl:
	issues.append({
	"code": "NO_TILE_TOTAL",
	"level": "warning",
	"message": "tileset 中未检测到 (total N)，容易导致牌数不自洽。"
	})

	# 5) invariants 强制项（Prompt 硬性要求）
	if "tile_conservation" not in mgdl:
	issues.append({
	"code": "NO_TILE_CONSERVATION",
	"level": "warning",
	"message": "(invariants ...) 中未检测到 tile_conservation；建议补齐以显式声明牌数守恒。"
	})
	if "hand_size_stable" not in mgdl:
	issues.append({
	"code": "NO_HAND_SIZE_STABLE",
	"level": "warning",
	"message": "(invariants ...) 中未检测到 hand_size_stable（或等价声明）；建议补齐以约束回合结束手牌稳定值。"
	})

	return issues


	def format_issues_for_llm(issues: List[Dict[str, str]]) -> str:
	if not issues:
	return ""
	lines = []
	for idx, it in enumerate(issues, start=1):
	lines.append("{0}. [{1}] {2}".format(idx, it.get("code"), it.get("message")))
	return "\n".join(lines).strip()