update

Zeqiang-Lai · May 16, 2023 · 57b169f · 57b169f
1 parent 89b7104
commit 57b169f
Show file tree

Hide file tree

Showing 6 changed files with 15 additions and 4 deletions.
diff --git a/README.md b/README.md
@@ -8,9 +8,9 @@ Generate image from anything with [ImageBind](https://github.com/facebookresearc
 
 ## Audio to Image
 
-| `assets/bird_audio.wav` | `assets/dog_audio.wav` | 
-| --- | --- |
-| ![](assets/generated/bird_audio.png) | ![](assets/generated/dog_audio.png) |
+| `assets/wav/bird_audio.wav` | `assets/wav/dog_audio.wav` |  `assets/wav/cattle.wav`
+| --- | --- | --- | 
+| ![](assets/generated/bird_audio.png) | ![](assets/generated/dog_audio.png) |![](assets/generated/cattle.png) |
 
 ```python
 import imagebind
@@ -30,7 +30,7 @@ model.to(device)
 
 # generate image
 with torch.no_grad():
-    audio_paths=["assets/bird_audio.wav"]
+    audio_paths=["assets/wav/bird_audio.wav"]
     embeddings = model.forward({
         imagebind.ModalityType.AUDIO: imagebind.load_and_transform_audio_data(audio_paths, device),
     })

diff --git a/assets/generated/cattle.png b/assets/generated/cattle.png
diff --git a/assets/bird_audio.wav → assets/wav/bird_audio.wav b/assets/bird_audio.wav → assets/wav/bird_audio.wav
diff --git a/assets/wav/cattle.wav b/assets/wav/cattle.wav
diff --git a/assets/dog_audio.wav → assets/wav/dog_audio.wav b/assets/dog_audio.wav → assets/wav/dog_audio.wav
diff --git a/requirements.txt b/requirements.txt
@@ -0,0 +1,11 @@
+diffusers
+torch==1.13
+torchvision==0.14.0
+torchaudio==0.13.0
+pytorchvideo @ git+https://github.com/facebookresearch/pytorchvideo.git@28fe037d212663c6a24f373b94cc5d478c8c1a1d
+timm==0.6.7
+ftfy
+regex
+einops
+fvcore
+decord==0.6.0