[v7,0/8] Buddy allocator like (or non-uniform) folio split

Message ID	20250211155034.268962-1-ziy@nvidia.com
Headers	show Received: from NAM04-DM6-obe.outbound.protection.outlook.com (mail-dm6nam04on2064.outbound.protection.outlook.com [40.107.102.64]) (using TLSv1.2 with cipher ECDHE-RSA-AES256-GCM-SHA384 (256/256 bits)) (No client certificate requested) by smtp.subspace.kernel.org (Postfix) with ESMTPS id 6273C250BF1; Tue, 11 Feb 2025 15:50:41 +0000 (UTC) From: Zi Yan <ziy@nvidia.com> To: linux-mm@kvack.org, Andrew Morton <akpm@linux-foundation.org>, "Kirill A . Shutemov" <kirill.shutemov@linux.intel.com>, "Matthew Wilcox (Oracle)" <willy@infradead.org> Cc: Ryan Roberts <ryan.roberts@arm.com>, Hugh Dickins <hughd@google.com>, David Hildenbrand <david@redhat.com>, Yang Shi <yang@os.amperecomputing.com>, Miaohe Lin <linmiaohe@huawei.com>, Kefeng Wang <wangkefeng.wang@huawei.com>, Yu Zhao <yuzhao@google.com>, John Hubbard <jhubbard@nvidia.com>, Baolin Wang <baolin.wang@linux.alibaba.com>, linux-kselftest@vger.kernel.org, linux-kernel@vger.kernel.org, Zi Yan <ziy@nvidia.com> Subject: [PATCH v7 0/8] Buddy allocator like (or non-uniform) folio split Date: Tue, 11 Feb 2025 10:50:25 -0500 Message-ID: <20250211155034.268962-1-ziy@nvidia.com> Content-Transfer-Encoding: 8bit Content-Type: text/plain Precedence: bulk MIME-Version: 1.0
Series	Buddy allocator like (or non-uniform) folio split \| expand [v7,0/8] Buddy allocator like (or non-uniform) folio split [v7,2/8] mm/huge_memory: add two new (not yet used) functions for folio_split() [v7,4/8] mm/huge_memory: add buddy allocator like (non-uniform) folio_split() [v7,6/8] mm/huge_memory: add folio_split() to debugfs testing interface. [v7,8/8] selftests/mm: add tests for folio_split(), buddy allocator like split.

Message ID

20250211155034.268962-1-ziy@nvidia.com

Headers

From: Zi Yan <ziy@nvidia.com>
To: linux-mm@kvack.org,
	Andrew Morton <akpm@linux-foundation.org>,
	"Kirill A . Shutemov" <kirill.shutemov@linux.intel.com>,
	"Matthew Wilcox (Oracle)" <willy@infradead.org>
Cc: Ryan Roberts <ryan.roberts@arm.com>,
	Hugh Dickins <hughd@google.com>,
	David Hildenbrand <david@redhat.com>,
	Yang Shi <yang@os.amperecomputing.com>,
	Miaohe Lin <linmiaohe@huawei.com>,
	Kefeng Wang <wangkefeng.wang@huawei.com>,
	Yu Zhao <yuzhao@google.com>,
	John Hubbard <jhubbard@nvidia.com>,
	Baolin Wang <baolin.wang@linux.alibaba.com>,
	linux-kselftest@vger.kernel.org,
	linux-kernel@vger.kernel.org,
	Zi Yan <ziy@nvidia.com>
Subject: [PATCH v7 0/8] Buddy allocator like (or non-uniform) folio split
Date: Tue, 11 Feb 2025 10:50:25 -0500
Message-ID: <20250211155034.268962-1-ziy@nvidia.com>
Content-Transfer-Encoding: 8bit
Content-Type: text/plain
Precedence: bulk
MIME-Version: 1.0
X-MS-Exchange-AntiSpam-MessageData-ChunkCount: 1
X-MS-Exchange-AntiSpam-MessageData-0: 
 BGHDQDdd0a5gimA+Weh7qVNwvfvIhAihNgkuFNNaNVMr+PrKQlgJs3sFjSEtNJ354sGf8rbVh5allz43JX2IObt3Kb4//+xshSgCjGpRWKrdlZvl5EjfwUiiFMPa8CD6FTDEkiUd+Rxf9vDXuMcF3uIb0JXUTHRUMij7OWAo7R3PFK5uMox3j0SfOtF6BZMiuQ1SEHN4LsEOO/5msUj4UgI5VBPm2NhSnnF7+FPrlMvVe2NLOXet8wS+mUZc/FMq9pbi6fKkX7UxX3VUoQkzVuzuEquWRetRkSVH4W/xbKSwsCudW+RjOQEc/7K7kFlJfy2FRUJANs9QKxkKtSMRvm3vflQs6XLLilMDyTzYetESkrfzPY/sUhRKDNNmAcjaCj5LwcONK34SJXC+I4JbydCMuEZ/bKUrvMS2zqULruG9ZSbEtz8QkW8LmeJH8e22UhxoB/LYOaZ0ZqshKTDzvZAIqudgu+J3pmtCM6l3OoqUfzG/EgDq8zwOvtyr/3o2qh4fxBX+vp06yY5qbem63nBzc11/b9U3yEg/9pM+mFvyd8B18Wmm9MKd+eKv7SeQidiE/08b1HWA+V1MKMSDBhOPmUtFNpWIBms166aPkwz9B/7Q9cne4Tnl/Ev/jTOCC/MVENK+pPnyTFj/h9gu672x5nx0t/v82NFBB22SYjjiskhu87uMkdVwyBWM6pJZLLMJbCV9ksXG8IuxvoAYJvMnB3X32G8Ypzp+cuzDu8H9/TAS6YOaTYz6+wN5H/25fOnl+b32MjNjWTFLy67xxBN78aBWzpQOyTK56cA+SW/5kxZgVx8CDR5DqYsG6c+7g4/XuW6+e6nY/AnwyAvp3r05WWnApOnpJmcE/Kwn+BIIDJEAYLZph0YzuzeijIUoK2VurND3CPmlAihtNmfgyW6TrQGmhJ9QCI7XW2OcT8y6ZyBOTcvFPFN7Rids9Iq13rH2MHsYfoTGkeSQUNWUqk2rAsRuWbFTH6/iq5TACcvs50sSFTMXbbSESO3VH0dH9QFzykf/FK7vw/1VVIvvpTFKdReQs0mLL0IfILG9zyWvvIHDra/vcnMmizs3UH0w+4i26RNIkopSOPxzd5j/AsWXslTuUN61HkjHuE5NAdW2jid9/YO7WWb9k0O6jqvYf3440ChGIJ/GKHHGvT59j89PlFyEHTXRbpgtJn6K4EtupVd8Mryc+bffS5VgyY6TwylV6e9Fsc0wdwuNN1AZ8eW3rgt9OSOHRQ56orfNukhnyg5dAudmpbh6yoKwB3o8cQi5xY+ui/+8Zrq1KYs6tl15UAZAe6VC7PgNojLOqTKmiqdR4Gq97fNgYvYKNhBxiNk0xlEgyXDt5lWPjlaN3OpgmJqTAnHYdpLO3TTmLyxo4s2bbCaLqIw23lRrgCpzTiAGSO2mHI3dkaa5jEcED4Mp8jGzWJZMQUMJSoGV3I7xZDK2Hd3eN2MeVdIYtmQE7Z5uGpLYLrG+MrBK0O/C1kHrGJpysqMAH8IbLjzYRxYsdz9ypGqLq7btEqTjXFyYJKBev4sZZaqfF3BrcIrvY+Mfxrh2qXXxTCRKcwxaYcH5CL1oQYjZNS8JA+NHiqHL
X-OriginatorOrg: Nvidia.com
X-MS-Exchange-CrossTenant-Network-Message-Id: 
 a6e2c644-86ab-46a1-504b-08dd4ab3d3d7
X-MS-Exchange-CrossTenant-AuthSource: DS7PR12MB9473.namprd12.prod.outlook.com
X-MS-Exchange-CrossTenant-AuthAs: Internal
X-MS-Exchange-CrossTenant-OriginalArrivalTime: 11 Feb 2025 15:50:37.1306
 (UTC)
X-MS-Exchange-CrossTenant-FromEntityHeader: Hosted
X-MS-Exchange-CrossTenant-Id: 43083d15-7273-40c1-b7db-39efd9ccc17a
X-MS-Exchange-CrossTenant-MailboxType: HOSTED
X-MS-Exchange-CrossTenant-UserPrincipalName: 
 Di7lrJ5TGR2beILhXIdGxPWhgZTwX6hb9Y7B68dCdgDOZX/esm8PGJtesntXl19m
X-MS-Exchange-Transport-CrossTenantHeadersStamped: SA3PR12MB8764

Series

Buddy allocator like (or non-uniform) folio split | expand

Message

Zi Yan Feb. 11, 2025, 3:50 p.m. UTC

Hi Matthew,

Can you please take a look at Patch 1 and let me know if the new xarray
function looks good to you? I will send __filemap_add_folio() and
shmem_split_large_entry() changes separately.

Hi all,

This patchset adds a new buddy allocator like (or non-uniform) large folio
split from a order-n folio to order-m with m < n. It reduces
1. the total number of after-split folios from 2^(n-m) to n-m+1;
2. the amount of memory needed for multi-index xarray split from 2^(n/6-m/6) to
   n/6-m/6, assuming XA_CHUNK_SHIFT=6;
3. keep more large folios after a split from all order-m folios to
   order-(n-1) to order-m folios.
For example, to split an order-9 to order-0, folio split generates 10
(or 11 for anonymous memory) folios instead of 512, allocates 1 xa_node
instead of 8, and leaves 1 order-8, 1 order-7, ..., 1 order-1 and 2 order-0
folios (or 4 order-0 for anonymous memory) instead of 512 order-0 folios.

It is on top of mm-everything-2025-02-07-05-27 with V6 reverted. It is ready to
be merged.


Instead of duplicating existing split_huge_page*() code, __folio_split()
is introduced as the shared backend code for both
split_huge_page_to_list_to_order() and folio_split(). __folio_split()
can support both uniform split and buddy allocator like (or non-uniform) split.
All existing split_huge_page*() users can be gradually converted to use
folio_split() if possible. In this patchset, I converted
truncate_inode_partial_folio() to use folio_split().

xfstests quick group passed for both tmpfs and xfs.


Changelog
===