RECRUIT 日本橋ハーフマラソン 2025秋（AtCoder Heuristic Contest 055）の参加記と復習記録

0.はじめに
1.問題の概要
2.コンテスト参加時の記録
3.反省
4.復習（貪欲）
5.復習（焼きなまし）
6.復習（より良い評価）

0.はじめに

はじめまして、もしくはお久しぶりです。競技プログラミング歴5年10か月のかえでです。

これは、2025年10月19日日曜日午後7時から午後11時までの4時間コンテスト「RECRUIT 日本橋ハーフマラソン 2025秋（AtCoder Heuristic Contest 055）」に参加したときのメモを元にした簡単な参加記と、その後の復習を書いたものです。

1.問題の概要

atcoder.jp

【メモ】

宝箱N=200個固定
宝箱　B（ID）
宝箱　硬さ　H
武器　耐久　C
武器　攻撃　A　Cが1減る
素手　Hを1減らす
使用武器　攻撃対象B

2.コンテスト参加時の記録

問題文理解も兼ねて、ChatGPTに問題文を投げます。

最初に素手で全ての宝箱を開けるプログラムを提出をします。全てのテストケースが1点なので、150点を得ました。（19時9分）

その後、高効率武器から使うプログラムを書くように指示します。解法価値として（価値/硬さ）を使用したプログラムを提案されます。

プログラムをpahcerで実行し、100テストケースの結果を見ます。最初に書いた素手で全ての宝箱を開けるときは全てのテストケースが1点でしたが、平均スコア、53312が出ました。

オーバーキルをしない方が良いのではないかと考えますが、結果は芳しくありませんでした。元に戻して提出をします。

コンテスト開始から15分が経過したところでした。スコアは7968139が出ました。

プログラムの内容に自分の理解が追いつきません。プログラムの内容を説明させて、今後の方針を考えます。

このときのプログラムは下記のような内容になっていました。

解法
- 入力
  - N 個の宝箱。硬さ H_i。各箱を開けると同番号の武器 i が手に入り、耐久 C_i 回だけ使える。
  - 武器 w で箱 b を殴ると A[w,b] だけ削れる（1 手消費）。素手は常に 1 ダメで無制限。
- 事前評価
  - 各箱 i を開けたときに得られる武器行（= A[i,*]）の強さから、「上位 C_i 個のダメージ合計 − C_i（= 素手との差分）」を value[i] として見積もる。
  - その価値を硬さで割った比 score_ratio[i] = value[i] / H_i を計算（＝「この箱を開けるコスパ」の近似）。
- ループの方針
  1. 使える武器がある間：
    - まず「一撃で開けられる」(A[w,b] ≥ hp[b]) 組合せを探し、score_ratio[b] が最大になる箱を優先して開ける（＝新しい武器の解放を重視）。
    - 一撃候補がなければ、素手との差分 A[w,b] − 1 が最大になる (w,b) を 1 手だけ撃つ（＝1 手あたりの得最大）。
  2. どの武器も実質 1 ダメ相当しか出せない/使える武器が無いとき：
    - 素手で殴る箱を score_ratio 最大で選び、開くまで素手連打して武器解放。
  3. 箱が開いたらその武器が使えるようになり、上記を繰返す。
  - 出力は時系列に (W,B)（素手は W = -1）。
- ねらい
  - 新武器の解放価値を粗く見積もってコスパの良い箱から開ける。
  - 攻撃 1 手ごとに “素手との差分” が最大な一撃を選ぶことで、総手数を減らす。
いまの方針の強みと限界

強み
- 実装が軽く、N=200 でも十分速い。
- 「武器解放の価値」を導入しており、全素手よりはだいぶ強い。
- 一撃開封の優先で新武器チェーンを作りやすい。
限界（改善余地）
1. value[i] は静的近似で、状態（残 HP、残耐久）に応じた真の限界効用を反映できていない。
2. 「一撃以外」のときは、単に A[w,b]−1 最大を叩くが、強い一撃の節約や最小十分打ができていない。
3. 「素手連打で開け切る」意思決定に、他武器の将来価値（機会損失）を考慮できていない。
4. 局所判断の積み重ねのため、解放順序の全体最適に届きにくい。

問題理解を努めている間に、現在の提出人数は342人。順位は76位まで落ちていました。入力生成方法を見ます。Aの攻撃力は小さな数字が並び、ところどころに大きな値があるということに気づきます。

得意な宝箱を攻撃するようにします。

プログラムを修正して提出をすると、順位は少し上がりました。（19時47分）

順位表のトップです。トップでは、1ケース平均57,246.7スコアが出ているようです。

まずはビームサーチにしてみます。しかし、スコアは上がりません。改善する目途も立たなかったのであきらめます。

次に焼きなますことを考えます。

さて、何を焼きなますかという話なのですが、ある宝箱のグループを作り、それを素手で先に全て開けることとし、その後貪欲をします。

その最初に開ける宝箱のグループを焼きなましました。最初に素手で開ける宝箱の数が少なくなることを目標とします。

少しよくなったので提出をします。得点は8191768となり、478人中31位になりました。（20時4分）

改善するために、ログを出力して、結果を見ます。得意な武器を使う方法が思いつきません。

良いアイデアが浮かばないまま、時間が過ぎていきます。得意な武器の重みや、使用する閾値を変えたりといったことを試しますが、ベストを更新することができません。

順位表のトップを見ます。コンテスト開始から1時間40分が経過していました。1位のnikajさんのスコアは、8773373、1ケース平均にすると58489.2です。私のベストの提出での平均は54611.8です。

この差をどうやったら埋めることができるのでしょうか。

ビジュアライザを見ます。

素手で攻撃する宝箱が最後まで残っていること
攻撃回数が複数回残っている武器が残っていること

が気になりました。

宝箱を開くことができなくても、武器を使うことで手数が減ることを評価に追加します。

うーん、うまくいきません。

時刻は午後9時を過ぎました。順位は669人中86位まで下がっています。

高速化します。

提出をすると、ほんの少しだけ良くなりました。

ビジュアライザを眺めます。素手で開く宝箱がまだ多く残っています。

近傍の入れ忘れに気づいてので、近傍を追加します。

素手と武器1回のswap

良くなりません。

時間を10秒にしてスコアが良くなるかを見ます。

ほんの少しよくなる程度でした。やはり、今の解法に足りないものがありそうです。

たまに2番目に良いものを選択するようにします。

結果はイマイチでした。

攻撃力が高い、回数が多い、武器を良い武器と評価します。
良い武器を最小手数で壊すために、その宝箱の攻撃力が高い武器がある宝箱をその前に開けると考えます。

そのような再帰的に考えたとき、素手で最初に開ける宝箱が見つかりそうです。とは思うものの、実装方針が思い浮かびません。

午後10時を過ぎました。残り時間は1時間を切りました。

順位表のトップスコアは8826896になっていました。トップの1ケース平均スコアは58,846です。

その後、焼きなましの近傍を追加し、少し良くなりました。

しかし、大きな改善方法が見つからないまま、コンテストが終了しました。

最終提出のスコアは8223523で、スコア更新をすることはできませんでした。

最終結果は852人中201位という結果に終わりました。

3.反省

最初のChatGPTの解法でのスコアが思った以上によかったので、自分の思考が停止してしまったように思います。ルールで使用が許可されている以上、4時間のコンテストで自分が使わないという選択肢はないのですが、もうちょっと良い距離感で使用できるようになりたいものです。

結果としての順位はそこまで悪くないのですが、不完全燃焼なコンテストでした。

入力を見て、得意な武器で攻撃することが重要だということには気がついていました。そこからもうちょっと考察を深めたかったです。

4.復習（貪欲）

さて、復習を開始します。chatGPTは使わない縛りで、自分の理解度にあわせて進めます。

AHCラジオのtomerunさんの解説を参考にします。

www.youtube.com

【貪欲1】

0からスタートして、N個をID順に宝箱を開ける
2個目以降はその前に開けた宝箱の武器を使用する

seed0　スコア2820　ターン数54462

【貪欲2】

0からスタートして、次の宝箱は持っている武器の攻撃力が一番高くなる宝箱を選ぶ

seed0　スコア37342　ターン数19940

【貪欲3】

貪欲2に追加
スタート位置をN通り試してベストを出力する

seed0　スコア40917　ターン数16365

【貪欲4】

貪欲3に追加
前の宝箱の武器以外に、残っている武器も使う

seed0　スコア41753　ターン数15529

【貪欲5】

貪欲4に追加
宝箱に対する攻撃力が10以下の武器は温存

seed0　スコア46897　ターン数10385

【貪欲5-2】

貪欲4に追加
宝箱に対する攻撃力が25以下の武器は温存

seed0　スコア48333　ターン数8949

【貪欲6】

貪欲5に追加
次の宝箱を選ぶときは、今ある武器で一番攻撃できるものを選ぶ

あ、バグってました。一番最初に開けた宝箱の武器を追加するのを忘れていました。修正します。

seed0　スコア50077　ターン数7205

あ、判定時に攻撃力に使用回数を掛けるのを忘れていました。

【貪欲6バグ修正】

seed0　スコア50929　ターン数6353

というわけで、貪欲で本番467位相当の得点、7922030になりました。

5.復習（焼きなまし）

次に、先ほどの貪欲6を初期解にして焼きなましをします。ここからは適宜LLMの力を借りることにします。

しかし、貪欲6の初期解を作るのに、すでに700msかかっています。何か無駄なことをしていそうです。

時間を計測したところ、スタート位置をN通り試していて、一回につき3msほど使用しているので、600msほど費やしているようです。

初期解を作成する際、解法価値（攻撃力*使用回数/硬さ）を計算して、一番良いものからスタートすることにし、N通り試すことをやめます。

実行時間は21msになりました。提出すると、得点は7677374になりました。これを初期解とすることにします。

宝箱を開ける順番を2点swapで変更し、シミュレーションをします。seed0での試行回数は5971回、改善数は38でした。初期解のターン数7250が5394に改善しているので、かなり良くなっているものの、100テストケースの平均は53742でした。解説放送でのスコア（平均56077）には到底及びません。

また、数万回試行できるということなので、高速化を考えます。

なお、実行時間を10秒にすると、さらに1000程度スコアが良くなることがわかりました。