Computer Science > Computer Vision and Pattern Recognition

arXiv:2303.03755 (cs)

[Submitted on 7 Mar 2023]

Title:DLT: Conditioned layout generation with Joint Discrete-Continuous Diffusion Layout Transformer

Authors:Elad Levi, Eli Brosh, Mykola Mykhailych, Meir Perez

View PDF

Abstract:Generating visual layouts is an essential ingredient of graphic design. The ability to condition layout generation on a partial subset of component attributes is critical to real-world applications that involve user interaction. Recently, diffusion models have demonstrated high-quality generative performances in various domains. However, it is unclear how to apply diffusion models to the natural representation of layouts which consists of a mix of discrete (class) and continuous (location, size) attributes. To address the conditioning layout generation problem, we introduce DLT, a joint discrete-continuous diffusion model. DLT is a transformer-based model which has a flexible conditioning mechanism that allows for conditioning on any given subset of all the layout component classes, locations, and sizes. Our method outperforms state-of-the-art generative models on various layout generation datasets with respect to different metrics and conditioning settings. Additionally, we validate the effectiveness of our proposed conditioning mechanism and the joint continuous-diffusion process. This joint process can be incorporated into a wide range of mixed discrete-continuous generative tasks.

Subjects:	Computer Vision and Pattern Recognition (cs.CV); Artificial Intelligence (cs.AI); Machine Learning (cs.LG)
Cite as:	arXiv:2303.03755 [cs.CV]
	(or arXiv:2303.03755v1 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2303.03755

Submission history

From: Elad Levi [view email]
[v1] Tue, 7 Mar 2023 09:30:43 UTC (7,612 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:DLT: Conditioned layout generation with Joint Discrete-Continuous Diffusion Layout Transformer

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:DLT: Conditioned layout generation with Joint Discrete-Continuous Diffusion Layout Transformer

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators