rcu_preempt self-detected stall in filemap_get_read_batch

Daniel Dao <dqminh@xxxxxxxxxxxxxx> · Tue, 9 May 2023 17:28:19 +0100

Hi Matthew,

I'm trying to track down a problem that occurred intermittenly when
doing rocksdb compaction
and manifested in RCU self detected stall

  [949170.657126][   C97] rcu: INFO: rcu_preempt self-detected stall on CPU
  [949170.666237][   C97] rcu:    97-....: (701243 ticks this GP)
idle=948c/1/0x4000000000000000 softirq=295729919/295729919 fqs=286689
  [949170.683019][   C97]         (t=718763 jiffies g=500631033
q=31964872 ncpus=128)
  [949170.692508][   C97] CPU: 97 PID: 184960 Comm: rocksdb:low1
Kdump: loaded Tainted: G        W  O L     6.1.22-cloudflare-2023.3.27
#1
  [949170.710034][   C97] Hardware name: HYVE
EDGE-METAL-GEN11/HS1811D_Lite, BIOS V0.11-sig 12/23/2022
  [949170.721788][   C97] RIP: 0010:xas_load+0x61/0xa0
  [949170.729326][   C97] Code: ea 83 e2 3f 89 d0 48 83 c0 04 48 8b 44
c6 08 48 89 77 18 48 89 c1 83 e1 03 48 83 f9 02 75 08 48 3d fd 00 00
00 76 0d 88 57 12 <80> 3e 00 75 a5 c3 cc cc cc cc 48 c1 e8 02 89 c2 89
c0 48 83 c0 04
  [949170.757643][   C97] RSP: 0018:ffffabeee65f3bf8 EFLAGS: 00000293
  [949170.766704][   C97] RAX: fffff17ec1cc3000 RBX: ffffabeee65f3d70
RCX: 0000000000000000
  [949170.777729][   C97] RDX: 0000000000000000 RSI: ffff99e781536d80
RDI: ffffabeee65f3c00
  [949170.788799][   C97] RBP: 000000000000157e R08: 0000000000000402
R09: fffff17ec1cc3000
  [949170.799865][   C97] R10: 0000000000000001 R11: 0000000000000000
R12: ffffabeee65f3e90
  [949170.810927][   C97] R13: 000000000000157e R14: 0000000000001540
R15: ffff99e2615f6538
  [949170.821983][   C97] FS:  00007ff7be571700(0000)
GS:ffff99d51fc40000(0000) knlGS:0000000000000000
  [949170.834065][   C97] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
  [949170.843820][   C97] CR2: 00007fa0ea422000 CR3: 0000004b17f62002
CR4: 0000000000770ee0
  [949170.855008][   C97] PKRU: 55555554
  [949170.861762][   C97] Call Trace:
  [949170.868244][   C97]  <TASK>
  [949170.874358][   C97]  filemap_get_read_batch+0x186/0x250
  [949170.882949][   C97]  filemap_get_pages+0xa2/0x630
  [949170.890991][   C97]  ? free_unref_page_commit+0x7c/0x170
  [949170.899646][   C97]  ? _raw_spin_unlock_irqrestore+0x1b/0x40
  [949170.908603][   C97]  ? free_unref_page+0x1a8/0x1e0
  [949170.916604][   C97]  filemap_read+0xc1/0x320
  [949170.923990][   C97]  ? find_css_set+0x200/0x680
  [949170.931570][   C97]  xfs_file_buffered_read+0x50/0xd0
  [949170.939639][   C97]  xfs_file_read_iter+0x6a/0xd0
  [949170.947322][   C97]  vfs_read+0x204/0x2d0
  [949170.954298][   C97]  __x64_sys_pread64+0x90/0xc0
  [949170.961865][   C97]  do_syscall_64+0x3b/0x90
  [949170.969094][   C97]  entry_SYSCALL_64_after_hwframe+0x4b/0xb5
  [949170.977781][   C97] RIP: 0033:0x7ff7ee27b917
  [949170.984964][   C97] Code: 08 89 3c 24 48 89 4c 24 18 e8 05 f4 ff
ff 4c 8b 54 24 18 48 8b 54 24 10 41 89 c0 48 8b 74 24 08 8b 3c 24 b8
11 00 00 00 0f 05 <48> 3d 00 f0 ff ff 77 31 44 89 c7 48 89 04 24 e8 35
f4 ff ff 48 8b
  [949171.013041][   C97] RSP: 002b:00007ff7be56d1b0 EFLAGS: 00000293
ORIG_RAX: 0000000000000011
  [949171.024300][   C97] RAX: ffffffffffffffda RBX: 0000000001595dd0
RCX: 00007ff7ee27b917
  [949171.035104][   C97] RDX: 00000000000b20c3 RSI: 0000000027460000
RDI: 0000000000000050
  [949171.045842][   C97] RBP: 00007ff7be56d2f0 R08: 0000000000000000
R09: 00007ff7be56d3a0
  [949171.056529][   C97] R10: 00000000014cccf2 R11: 0000000000000293
R12: 0000000003a2fc80
  [949171.067185][   C97] R13: 00000000000b20c3 R14: 00000000000b20c3
R15: 00000000014cccf2
  [949171.077761][   C97]  </TASK>

We have not been able to reproduce this reliably.

Does this look similar to problems seen in
https://lore.kernel.org/linux-mm/Y1lZ9Rm87GpFRM%2FQ@xxxxxxxxxxxxxxxxxxxx/.
I wonder if it's reasonable to try the patch and see what we have
since it looks sane.

Best,
Daniel.